基于卷积神经网络的网络文本分类任务书

 2021-11-08 22:04:53

1. 毕业设计(论文)主要目标:

在自然语言处理中,大部分工作采用深度学习的方法,通过神经语言模型学习单词矢量表示,并对血单词向量进行分类,单词从稀疏的1-of-V编码经过隐藏层投影到低纬度的向量空间上(就是提取编码维度中单词的语义特征),这些语义特征是用欧几里德或余弦距离表示的。利用卷积神经网络(CNNs)来进行句子分类,并通过随机搜索和贝叶斯优化来对超参数优化。

2. 毕业设计(论文)主要内容:

(1):对全部训练文档进行分词,由这些词作为向量的维数来表示文本;(2):统计每一类文档中所有出现的词语及其频率,然后过滤,剔除停用词和单字词;(3):统计每一类内出现词语的总词频,并取若干个频率更高的词汇作为这一类的特征词集;(4):去除每一类别中都出现的词,合并所有类别的特征词集,形成总特征词集,最后得到的特征词集是我们用到的特征集合,再用该集合去筛选测试集中的特征。

3. 主要参考文献

[1] 超人汪小建(seaboat).卷积神经网络文本分类.博客,2018.3.24.

[2] 夏婵.卷积神经网络在NLP领域的实践:文本分类.博客,2017.6.3.

[3] guoyuhaoaaa.几种使用了CNN(卷积神经网络)的文本分类模.博客,2016.11.16.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。