1. 毕业设计(论文)主要目标:
针对微博、Twitter等社交网络中出现的短文本信息,借助TensorFlow计算框架,将文本从符号型数据转为数值型的向量数据,形成一套完整的文本转化流程。
2. 毕业设计(论文)主要内容:
当前互联网每天都在产生大量的文本数据,通过挖掘这些数据,我们可以做一些更加便捷的应用,例如机器翻译、语音识别、词性标注以及信息检索等,这些都属于NLP范畴。而在NLP领域中,语言模型是最基本的一个环节。通过TensorFlow说明了一些文本处理技术。我们展示如何实现bag-of-words技巧和TF-IDF文本。针对向量空间模型在表示网络文本时存在特征词独立、向量高维稀疏等问题,本文用CBOW和skip-gram引入神经网络文本表示,利用大量样本数据训练,得到一个多维的分布式词向量集合,实现对文本的表示。
3. 主要参考文献
[1]林志宏,池宏,许保光.基于卷积神经网络的公安案件文本语义特征提取方法研究[J].数学的实践与认识,2017,47(17):127-140.
[2]章敏敏,徐和平,王晓洁,周梦昀,洪淑月.谷歌TensorFlow机器学习框架及应用[J].微型机与应用,2017,36(10):58-60.
[3]张小川,于旭庭,张宜浩.一种改进的向量空间模型的文本表示算法[J].重庆理工大学学报(自然科学),2017,31(01):87-92.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
