基于全卷积神经网络的文档图像二值化算法研究任务书

 2022-01-06 08:01

全文总字数:1408字

1. 毕业设计(论文)主要内容:

OCR作为一种自动解读文档图像符号的技术,一直以来都备受关注,尤其在信息时代的今天,数字图像纷繁复杂,如何便捷高效的获取其中的文字信息,更有着重要的时代意义。文档图像二值化是文档图像分析和识别流程中的一个重要步骤。为了让计算机更快的、更好地识别文字,需要先对含有噪音的彩色图进行处理,使图片只剩下前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图。设计的内容将主要包括三个任务:图像资源的采集,模型的建立与优化,算法的详细设计,采用Python语言实现。

2. 毕业设计(论文)主要任务及要求

1)首先采集相关数据集,对其进行分析,数据增强;

2)然后搜集相关资料,建立合适的模型对数据集进行训练,并对模型进行评估和改进;

3)最后利用二值化算法,将需要处理的图像转换为二值化图,以便后续进行字符识别。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

1)2020/1/13—2020/2/28:查阅参考文献,明确选题;完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。

2)2020/3/1—2020/4/30:对采集的相关数据集进行分析,数据增强;模型的建立与改进;二值化算法实现。

3)2020/5/1—2020/5/25:撰写及修改毕业论文。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] 周志华. 机器学习. 清华大学出版社,2016

[2] I. Pratikakis, K. Zagoris, G. Barlas and B.Gatos, “ICDAR2017 Competition on Document Image Binarization (DIBCO 2017)”, 14thIAPR International Conference on Document Analysis and Recognition, July. 03, 2017.

[3] G. chutani, T. Patnaik and V. Dwivedi ,“An Improved Approach for automatic denoising and Binarization of DegradedDocument Images Based on Region Localization”, 2015 International Conference onAdvances in Computing, Communications and Informatics (ICACCI)

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。