基于深度学习的基础教育领域分词方法任务书

 2021-08-20 10:08

1. 毕业设计(论文)主要内容:

词是“最小的能独立运用的语言单位”,由于中文具有大字符集连续书写的特点,如果不进行分析,计算机则无法得知中文词的确切边界,从而很难理解文本中所包含的语义信息。

因此,中文分词是自然语言处理的一个关键的基础技术,是其他中文应用,例如,命名实体识别、句法分析、语义分析等得前期文本处理关键环节。

以“文综”为代表的基础教育资源,蕴含了丰富的知识。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1、 研究面向中文基础教育资源的字表示方法;2、 基于深度神经网络对基础教育语料进行中文分词;3、 结合Web开放域资源构建基础教育知识库。

4、查阅15篇相关文献(含近五年外文3篇),并每篇书写200—300字文献摘要(装订成册,带封面);
5、认真填写周记,完成800字开题报告;
6、完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
7、完成系统的编码与调试;
8、完成10000字以上的毕业论文;
9、进行论文答辩。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1)2016/1/11—2016/1/22:查阅参考文献,明确选题;(2)2016/1/23—2016/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;(3)2016/3/8—2016/4/26:需求分析,算法或系统设计,分析、比较或实现等;(4)2016/4/27—2016/5/27:撰写论文初稿;修改论文,定稿并提交论文评审;(5)2016/5/28—2016/6/7:准备论文答辩。

4. 主要参考文献

[1] 来斯惟,徐立恒,陈玉博,刘康,赵军, 基于表示学习的中文分词算法探索, 中文信息学报,2013,27(5):8-14.[2] J. Hoffart; F. Suchanek; K. Berberich and G. Weikum. YAGO2: A Spatially and Temporally Enhanced Knowledge Base from Wikipedia. Artificial Intelligence Journal, 2012.[3] Liwei Chen, Yansong Feng, Yidong Chen, Lei Zou, and Dongyan Zhao, Towards Automatically Constructing Knowledge Bases from Chinese Resources, The 50th Annual Meeting of the Association for Computational Linguistics (ACL-SRW), Jeju Island, Korea, pp. 67-72, July 2012.[4] Yanjun Qi, Sujatha G. Das, Ronan Collobert, Jason Weston. Deep Learning for Character-Based Information Extraction. Lecture Notes in Computer Science Volume 8416, 2014, pp 668-674.[5] Xiaoqing Zheng, Hanyang Chen, Tianyu Xu. Deep learning for Chinese word segmentation and POS tagging. Proceedings of the Conference on Empirical Methods in NLP, pp. 647–657 (2013).

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。