全文总字数:2662字
1. 毕业设计(论文)的内容和要求
毕业设计内容:自然语言处理(Natural Language Processing, NLP)被越来越广泛地使用于语音识别,自动翻译,自动问答等等领域。
相比较于字母语言,中文NLP任务更加困难。
由于汉语不具有字母语言中的天然分隔符,因此分词是所有中文NLP任务的开端,也是极端重要的工作。
2. 实验内容和要求
1. 语料的预处理:包括数据清洗,将数据中错误值、异常值剔除,对缺失值进行处理。
2. 对处理好的语料进行特征工程;3. 使用预训练模型数据集进行处理,并与经典模型进行对比。
4. 调整模型参数使得训练出的模型效果更好。
3. 参考文献
[1] VASWANI A,SHAZEER N,PARMAR N.et al. Attention is all you need. Advances in Neural Information Processing Systems[J]. 2017
[2] Devlin J , Chang M W , Lee K , et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding[J]. 2018.
[3] 刘浏, 王东波. 命名实体识别研究综述[J]. 情报学报,2018,37(3):329-340.
4. 毕业设计(论文)计划
2021-01-18~2021-02-07 收集所用的数据集,查阅并学习相关文献,掌握并理解任务所需的基础知识; 2021-02-07~2021-02-28 学习使用传统方法完成简单的文本分类任务; 2021-03-01~2021-03-28 学习使用预训练模型,完成分词与命名实体识别任务; 2021-03-29~2021-05-02 核心算法的编程实现,模型的构建与调试,完成毕业设计要求的任务; 2021-05-03~2021-05-30 案例分析,论文撰写; 2021-05-31~2021-06-15 论文评阅,答辩。
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。