基于深度学习的多语言OCR模型研究任务书

 2021-08-22 23:59:45

1. 毕业设计(论文)主要内容:

文本在图像识别中是重要的语义特征,经常显示图像的内容及其自身的内容。因此,在许多应用中需要提取重要的图像文本。比如随着相机、智能手机、平板电脑等设备的普及,通过提取场景照片中的文本信息来获取场景地理信息。然而现今的OCR实现绝大部分都是针对单种语言,多语言处理仍面临着极大的挑战。现在常用的多语言识别方法结合多种不同的分类器,先通过语种识别,再使用相应的分类器进行识别。但是一般来说,如果不经过复杂的后处理过程,例如语言建模、使用字典矫正错误、字体适应等,得不到较好的输出结果。本课题研究如何基于深度学习,集成其他多种学习方法搭建OCR系统来识别多种语言,并且避免繁琐的预处理和后处理步骤,来获取高准确率的识别结果。

任务:

①研究基于LSTM循环神经网络来实现多语言的训练及识别过程。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1. 查阅15篇相关文献(含2篇外文),并每篇书写200——300字文献摘要(装订成册,带封面);

2. 完成800字开题报告;

3. 完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

2017-01-14至2017-02-22:确定选题,查阅文献,外文翻译和撰写开题报告;

2017-02-23至2017-04-30:系统架构、程序设计与开发、系统测试与完善;

2017-05-01至2017-05-25:撰写及修改毕业论文;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

1. 软件工程(第2版),钱乐秋等,清华大学出版社,2013年。

2. Web前段开发技术-HTML、CSS、JavaScript, 聂常红,人民邮电出版社,2013年。

3. 大数据时代-生活、工作与思维的大变革,[英]维克托.迈尔-舍恩伯格等,浙江人民出版社,2013.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。