基于特征提取和主题模型的中文文本分类系统的设计任务书

 2021-08-22 11:08

1. 毕业设计(论文)主要内容:

文本分类是指采用计算机程序对文本集按照一定的分类体系进行自动分类标记。文本分类步骤一般包括了文本的预处理、特征提取、分类器的选择、训练集训练、测试集测试、分类结果的评价等步骤。特征提取是通过对原始特征进行降维,以达到去除特征集中对文本分类无意义的特征,进而提高分类效果的最终目的。论文要求:1)学习文本特征向量的构建方法及常用的降维方法;2)学习各种分类器的基本原理及其训练与测试方法,并用主题模型优化分类器;3)设计并编程实现文本分类器;4)对试验结果进行分析,得出各种结论。

2. 毕业设计(论文)主要任务及要求

(1) 查阅不少于15篇(其中近5年的外文文献不少于3篇)的相关资料,完成开题报告(设计的目的及意义至少800汉字;基本内容和技术方案至少400汉字)。

(2) 学习文本特征向量的构建方法及常用的降维方法;学习各种分类器的基本原理及其训练与测试方法,并用主题模型优化分类器;设计并编程实现文本分类器;对试验结果进行分析,得出各种结论。

(3)完成不少于5000汉字(20000英文印刷符)的英文文献翻译。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1)第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。

(2)第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。

(3)6-9周:编程实现各算法,并进行仿真调试。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

(1) 王燕霞,基于相关主题模型的文本分类方法研究[C].苏州大学,2010

(2) 项珑,基于特征提取和主题模型的文本分类研究[C].安徽大学,2013

(3)张昭楠, 基于SVM的中文文本分类系统的设计与实现[J].电子设计工程,2016,16

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。