基于预训练模型的中文命名实体识别研究任务书

 2022-02-10 07:02

全文总字数:2662字

1. 毕业设计(论文)的内容和要求

毕业设计内容:自然语言处理(Natural Language Processing, NLP)被越来越广泛地使用于语音识别,自动翻译,自动问答等等领域。

相比较于字母语言,中文NLP任务更加困难。

由于汉语不具有字母语言中的天然分隔符,因此分词是所有中文NLP任务的开端,也是极端重要的工作。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 实验内容和要求

1. 语料的预处理:包括数据清洗,将数据中错误值、异常值剔除,对缺失值进行处理。

2. 对处理好的语料进行特征工程;3. 使用预训练模型数据集进行处理,并与经典模型进行对比。

4. 调整模型参数使得训练出的模型效果更好。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 参考文献

[1] VASWANI A,SHAZEER N,PARMAR N.et al. Attention is all you need. Advances in Neural Information Processing Systems[J]. 2017

[2] Devlin J , Chang M W , Lee K , et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding[J]. 2018.

[3] 刘浏, 王东波. 命名实体识别研究综述[J]. 情报学报,2018,37(3):329-340.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 毕业设计(论文)计划

2021-01-18~2021-02-07 收集所用的数据集,查阅并学习相关文献,掌握并理解任务所需的基础知识; 2021-02-07~2021-02-28 学习使用传统方法完成简单的文本分类任务; 2021-03-01~2021-03-28 学习使用预训练模型,完成分词与命名实体识别任务; 2021-03-29~2021-05-02 核心算法的编程实现,模型的构建与调试,完成毕业设计要求的任务; 2021-05-03~2021-05-30 案例分析,论文撰写; 2021-05-31~2021-06-15 论文评阅,答辩。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。