基于深度学习的基础教育领域分词方法任务书

 2021-08-20 22:33:09

1. 毕业设计(论文)主要内容:

词是“最小的能独立运用的语言单位”,由于中文具有大字符集连续书写的特点,如果不进行分析,计算机则无法得知中文词的确切边界,从而很难理解文本中所包含的语义信息。

因此,中文分词是自然语言处理的一个关键的基础技术,是其他中文应用,例如,命名实体识别、句法分析、语义分析等得前期文本处理关键环节。

以“文综”为代表的基础教育资源,蕴含了丰富的知识。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1、 研究面向中文基础教育资源的字表示方法;2、 基于深度神经网络对基础教育语料进行中文分词;3、 结合Web开放域资源构建基础教育知识库。

4、查阅15篇相关文献(含近五年外文3篇),并每篇书写200—300字文献摘要(装订成册,带封面);
5、认真填写周记,完成800字开题报告;
6、完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
7、完成系统的编码与调试;
8、完成10000字以上的毕业论文;
9、进行论文答辩。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1)2016/1/11—2016/1/22:查阅参考文献,明确选题;(2)2016/1/23—2016/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;(3)2016/3/8—2016/4/26:需求分析,算法或系统设计,分析、比较或实现等;(4)2016/4/27—2016/5/27:撰写论文初稿;修改论文,定稿并提交论文评审;(5)2016/5/28—2016/6/7:准备论文答辩。

4. 主要参考文献

[1] 来斯惟,徐立恒,陈玉博,刘康,赵军, 基于表示学习的中文分词算法探索, 中文信息学报,2013,27(5):8-14.[2] J. Hoffart; F. Suchanek; K. Berberich and G. Weikum. YAGO2: A Spatially and Temporally Enhanced Knowledge Base from Wikipedia. Artificial Intelligence Journal, 2012.[3] Liwei Chen, Yansong Feng, Yidong Chen, Lei Zou, and Dongyan Zhao, Towards Automatically Constructing Knowledge Bases from Chinese Resources, The 50th Annual Meeting of the Association for Computational Linguistics (ACL-SRW), Jeju Island, Korea, pp. 67-72, July 2012.[4] Yanjun Qi, Sujatha G. Das, Ronan Collobert, Jason Weston. Deep Learning for Character-Based Information Extraction. Lecture Notes in Computer Science Volume 8416, 2014, pp 668-674.[5] Xiaoqing Zheng, Hanyang Chen, Tianyu Xu. Deep learning for Chinese word segmentation and POS tagging. Proceedings of the Conference on Empirical Methods in NLP, pp. 647–657 (2013).

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付