特征选择方法在邮件分类中的应用任务书

 2021-08-19 23:27:36

1. 毕业设计(论文)主要目标:

1、研究文本数据的特征选择方法以及它们的优缺点

2、研究常用的几种文本分类方法

3、研究文本分类方法的性能评价指标

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要内容:

1、运用改进的卡方统计对邮件数据进行特征选择,分别用朴素贝叶斯及k近邻法对邮件进行分类,并利用查全率、查对率、宏平均、微平均以及F1值对分类方法进行性能评估

2、运用互信息对邮件数据进行特征选择,分别用朴素贝叶斯及k近邻法对邮件进行分类,并利用查全率、查对率、宏平均、微平均以及F1值对分类方法进行性能评估

3、比较在相同的特征数目下,改进的卡方统计和互信息的性能

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 主要参考文献

[1]张鹏招.基于卡方统计的中文文本分类特征选择方法研究[D].重庆大学,2008.

[2]肖婷,唐雁.改进的卡方统计文本特征选择方法[J].计算机工程与应用,2009,45(14):136-137.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。