OCR文字识别相关算法的研究与实现任务书

 2021-08-19 11:08

1. 毕业设计(论文)主要目标:

设计并完成能在手机端进行OCR识别的文字识别系统。能够识别office类文档的扫描件的印刷体,并且需支持中英文及数字识别,其中中文字体以宋体及黑体为主,又因为识别为印刷体,所以识别率要达到97%以上。文字识别系统分为六个模块,分别是图片获取模块、区间定位模块、预处理模块、字符分割模块、字符特征提取和匹配模块、文字识别模块。这六个模块能够将图片中的重要文字提取出来并进行识别,以供用户使用。

2. 毕业设计(论文)主要内容:

采用Java语言开发,以AndroidStudio为开发平台,用Matlab语言进行图像处理,设计一个手机端文字识别系统,实现对office文件的扫描件和自然背景下图片中文字的识别。

文字识别的基本设计步骤如下:1.预处理,对包含文字的图像进行处理以便后续进行特征提取学习;2.特征提取和降维;3.分类器设计、训练和实际识别;4.后处理,对分类结果进行优化。

考虑光照和扫描模糊程度等因素的影响,在设计系统时的预处理步骤中要去除图像中影响文字识别的背景。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 主要参考文献

[1]夏德琛,傅德胜.计算机图像处理及应用.东南大学出版社,2004.2.

[2] 夏开建,夏瑜.基于稀疏表达的图像文档二值化技术仿真研究[J].计算机仿真.2013(09):212-219.

[3] 王国权,周小红,蔚立磊.基于分水岭算法的图像分割方法研究.计算机仿真.1006-9348(2009)05- 0255- 04.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。