基于TensorFlow的社交网络文本向量表示方法研究任务书

 2021-11-08 22:18:00

1. 毕业设计(论文)主要目标:

针对微博、Twitter等社交网络中出现的短文本信息,借助TensorFlow计算框架,将文本从符号型数据转为数值型的向量数据,形成一套完整的文本转化流程。

2. 毕业设计(论文)主要内容:

当前互联网每天都在产生大量的文本数据,通过挖掘这些数据,我们可以做一些更加便捷的应用,例如机器翻译、语音识别、词性标注以及信息检索等,这些都属于NLP范畴。而在NLP领域中,语言模型是最基本的一个环节。通过TensorFlow说明了一些文本处理技术。我们展示如何实现bag-of-words技巧和TF-IDF文本。针对向量空间模型在表示网络文本时存在特征词独立、向量高维稀疏等问题,本文用CBOW和skip-gram引入神经网络文本表示,利用大量样本数据训练,得到一个多维的分布式词向量集合,实现对文本的表示。

3. 主要参考文献

[1]林志宏,池宏,许保光.基于卷积神经网络的公安案件文本语义特征提取方法研究[J].数学的实践与认识,2017,47(17):127-140.

[2]章敏敏,徐和平,王晓洁,周梦昀,洪淑月.谷歌TensorFlow机器学习框架及应用[J].微型机与应用,2017,36(10):58-60.

[3]张小川,于旭庭,张宜浩.一种改进的向量空间模型的文本表示算法[J].重庆理工大学学报(自然科学),2017,31(01):87-92.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版