基于CRF算法的中文社交媒体的事件发掘研究与实现任务书

 2021-08-21 10:08

1. 毕业设计(论文)主要内容:

网络社会和现实社会处于同一时空维度下,与现实社会息息相关。随着网络社会的发展,它能越来越真实地反映出现实社会的当前关注点、指定方向关注点等社会信息,甚至对现实社会正在施以越来越大的影响力。社交媒体(Social Media)承载了大量的信息,从中可以发掘出很多有指导、启发意义的内容。

社交媒体的事件发掘在几年前便开始受到关注,大量以Twitter为代表的英文社交媒体事件发掘系统得到研究。然而由于中文的特殊性,例如表意方式多种、理解方式多种、缩略语及新生词较多等,中文社交媒体事件发掘中很多语言处理问题,例如分词、词性标注等相对英文来说具有更大的挑战性,已有的中文自然语言处理技术并不完全适合直接用于中文社交媒体信息的处理,精确度(Accuracy)和召回(Recall)都比较低。

基于以上,本课题希望能够将中文自然语言处理技术与社交媒体自身特性相结合,进行中文社交媒体的事件发掘研究,设计并实现基于CRF的中文社交媒体事件发掘工具。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

主要任务:

1.微博信息获取和中文语言处理工具研究;

2.CRF方法的原理的研究;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

第1周—第4周搜集资料,撰写开题报告;

第5周—第6周论文开题;

第7周—第12周撰写论文初稿;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] Sitaram Asur and Bernardo A.Huberman. Predicting the Future With Social Media. Web Intelligence and Intelligent Agent Technology (WI-IAT), 2010 IEEE/WIC/ACM International Conference on (Volume: 1) [2] Della Pietra S, Della Pietra V, Mercer R L, et al. Adaptive language modeling using minimum discriminant estimation[C]. Acoustics Speech and Signal Processing, ICASSP-92. USA, 1992:633-636 [3] 文坤梅,徐帅,李瑞轩等. 微博及中文微博信息处理研究综述[J]. 中文信息学报,2012,26(6):27-37. [4] Chen A, Peng F, Shan R, et al. Chinese named entity recognition with conditional probabilistic models[C]. Proceedings of the 5th SIGHAN Workshop on Chinese Language Processing. Australia, 2006: p173-176. [5] 张晨逸,孙建伶, 丁轶群. 基于MB-LDA 模型的微博主题挖掘[J]. 计算机研究与发展, 2011, 48(10): 1795-1802.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。