基于fasttext算法的文本分类设计与实现任务书

 2021-08-20 12:08

1. 毕业设计(论文)主要目标:

fasttext是是facebook开发的一款快速文本分类器,提供简单而高效的文本分类的学习方法,性能比肩深度学习而且速度更快。fasttext结合了自然语言处理和机器学习中最成功的理念。这些包括了使用词袋以及N-gram袋表征语句,还有使用子字信息,并隐藏表征在类别间共享信息。本论文将采用python语言,在linux平台或者macos上实现基于fasttext算法的文本分类,并对实验结果进行验证。

2. 毕业设计(论文)主要内容:

本文首先会介绍一些预备知识,比如softmax,ngram等,然后简单介绍word2evc原理,之后来讲解fasttext的原理,并搭建一个简单的fasttext分类器,同时介绍一些fasttext的应用。

fasttext的原理:

1.模型架构;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 主要参考文献

1.李晓明,闫宏飞,王继民,《搜索引擎——原理、技术与系统》,2005年4月2.冯是聪, 《中文网页自动分类技术研究及其在搜索引擎中的应用》,2003年3.王涛:《文本自动分类研究,图书馆学研究 》,2007年12月4.周文霞:《现代文本分类技术研究》,2007年7月5.奉国和:《自动文本分类技术研究》,2013年4月

6.崔彩霞,张朝霞:《文本分类方法对比研究》,2011年6月7.刘霞,卢苇:《SVM在文本分类中的应用研究》,2007年8.刘霞,卢苇:《计算机教育》,2007年

9.Y. Yang and X. Liu, 'A re-exami,nation of text categorization methods' presented at Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR99), 10.F. Sebastiani, 'A tutorial on Automated Text Categorization', Proceedings of ASAI-99, 1st Argentinian Symposium on Artificial Intelligence, Buenos Aires, AR,

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。