1. 毕业设计(论文)主要内容:
词是“最小的能独立运用的语言单位”,由于中文具有大字符集连续书写的特点,如果不进行分析,计算机则无法得知中文词的确切边界,从而很难理解文本中所包含的语义信息。
因此,中文分词是自然语言处理的一个关键的基础技术,是其他中文应用,例如,命名实体识别、句法分析、语义分析等得前期文本处理关键环节。
以“文综”为代表的基础教育资源,蕴含了丰富的知识。
2. 毕业设计(论文)主要任务及要求
1、 研究面向中文基础教育资源的字表示方法;2、 基于深度神经网络对基础教育语料进行中文分词;3、 结合Web开放域资源构建基础教育知识库。
3. 毕业设计(论文)完成任务的计划与安排
(1)2016/1/11—2016/1/22:查阅参考文献,明确选题;(2)2016/1/23—2016/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;(3)2016/3/8—2016/4/26:需求分析,算法或系统设计,分析、比较或实现等;(4)2016/4/27—2016/5/27:撰写论文初稿;修改论文,定稿并提交论文评审;(5)2016/5/28—2016/6/7:准备论文答辩。
4. 主要参考文献
[1] 来斯惟,徐立恒,陈玉博,刘康,赵军, 基于表示学习的中文分词算法探索, 中文信息学报,2013,27(5):8-14.[2] J. Hoffart; F. Suchanek; K. Berberich and G. Weikum. YAGO2: A Spatially and Temporally Enhanced Knowledge Base from Wikipedia. Artificial Intelligence Journal, 2012.[3] Liwei Chen, Yansong Feng, Yidong Chen, Lei Zou, and Dongyan Zhao, Towards Automatically Constructing Knowledge Bases from Chinese Resources, The 50th Annual Meeting of the Association for Computational Linguistics (ACL-SRW), Jeju Island, Korea, pp. 67-72, July 2012.[4] Yanjun Qi, Sujatha G. Das, Ronan Collobert, Jason Weston. Deep Learning for Character-Based Information Extraction. Lecture Notes in Computer Science Volume 8416, 2014, pp 668-674.[5] Xiaoqing Zheng, Hanyang Chen, Tianyu Xu. Deep learning for Chinese word segmentation and POS tagging. Proceedings of the Conference on Empirical Methods in NLP, pp. 647–657 (2013).
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。