基于支持向量机的中文网页分类器的设计与实现任务书

 2021-08-23 08:08

1. 毕业设计(论文)主要内容:

中文网页的生成愈加变得多元化和规模化,以其为目标的分类技术也成为数据挖掘领域的一大热点。本文详细描述中文网页分类系统的设计与实现,使用Python语言进行实验数据的抓取,并将其存储在MySQL数据库中,把提取出的网页数据进行预处理后,输入到以支持向量机为分类算法的分类器中进行区分。详细分析实验结果,并以期能对分类算法提出改进。

2. 毕业设计(论文)主要任务及要求

(1)利用Python设计爬虫程序,从网上抓取实验网页数据;

(2)将网页数据存储在设计好的MySQL数据库中;

(3)用Java实现支持向量机的分类算法;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1)第1-3周:查阅相关文献资料,明确研究内容,学习毕业设计研究内容所需理论的基础。确定毕业设计方案,完成开题报告。

(2)第4-5周:掌握爬虫程序和分类算法的原理,完成英文资料的翻译,熟悉开发环境。

(3)第6-9周:完成整个系统的设计。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] Azhagusundari, B., and Antony Selvadoss Thanamani. "Featureselection based on information gain."International Journal ofInnovative Technology and Exploring Engineering (IJITEE) ISSN(2013):2278-3075.

[2] Xu, S. M., B. Wu, and C. Ma. "Efflcient SVM Chinese Web pageclassifier based on pre-classification."Computer Engineering andApplications(2010): 125-128.

[3] 许世明, 武波, 马翠,等. 一种基于预分类的高效SVM中文网页分类器[J].计算机工程与应用, 2010, 46(1):125-128.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。