1、I 目目 录录 前 言 . 1 第一章 绪 论 2 1.1 图像处理概论 . 2 1.2 图像处理的研究内容 2 1.3 图像处理的应用 . 3 1.4 本文的研究工作与创新点 4 第二章 文档图像处理. 5 2.1 文档图像的概述 . 5 2.1.1 文档图像获取 . 5 2.1.2 文档图像获取中的难题 5 2.2 文档图像的处理 . 6 2.2.1 图像去色及二值化 . 6 2.2.2 倾斜检测与校正 . 6 2.2.3 版面结构理解 . 7 2.3 扭曲文档图像的处理 8 2.3.1 基于 2D 文档图像分析 . 8 2.3.2 基于 3D 文档模型重建 . 8 2.3.3 比较与分析
2、. 9 2.4 本章小结 9 第三章 2D 文档图像扭曲恢复的预处理. 10 3.1 系统分析与设计 . 10 3.1.1 扭曲恢复技术流程 . 10 3.1.2 需求分析与系统设计 11 3.2 文档图像预处理 . 12 3.2.1 图像去色 12 3.2.2 噪声消除 13 3.2.2.1 噪声消除的方法 . 13 3.2.2.2 噪声消除的实现 . 14 II 3.2.2.3 实验结果与分析 . 14 3.2.3 图像二值化. 15 3.2.3.1 二值化算法. 16 3.2.3.2 实验结果与分析 . 18 3.3 本章小结 18 第四章 文档图像的扭曲恢复 19 4.1 字符和文本行
3、标识 . 19 4.1.1 标识的步骤. 19 4.1.2 标识算法伪代码 . 19 4.1.3 实验结果与分析 . 20 4.2 曲线分割与倾斜校正. 21 4.3 字符平移 . 23 4.3.1 平移的思想. 23 4.3.2 平移算法伪代码 . 24 4.3.3 实验结果与分析 . 24 4.4 本章小结 . 25 第五章 文档图像的后处理 . 26 5.1 断笔修复 . 26 5.2 背景恢复 . 26 5.3 实验结果与分析 27 5.3.1 OCR 测试 . 27 5.3.2 结果分析 31 5.4 本章小结 . 32 第六章 总结与展望 33 6.1 课题总结 . 33 6.2
4、后续研究展望 . 33 参考文献 . 34 作者攻读学士学位期间发表(录用)的论文 . 错误错误!未定义书签。未定义书签。 致 谢 . 36 III 摘摘 要要 在扫描、复印或者拍摄文档的过程中造成的图像扭曲在文档理解和处理方面是普遍 的问题。这种文档图像的扭曲降低了光学文字辨识(OCR)能力,也严重影响了其使用 效果。这是文档打印数字化和自动化过程中的主要障碍。 本课题的研究工作是对这种扭曲文档图像采用相关的技术进行一定的恢复。本文首 先介绍了文档图像的处理技术和当前已有的扭曲恢复技术, 然后重点描述了基于 2D 文档 图像分析的恢复技术的流程,及解决方案的设计,并付诸于程序实现。实验结果的分析 表明,文档图像扭曲恢复后的 OCR 识别率要明显高于恢复之前的。最后我们对课题的研 究进行总结和展望。 关键词关键词:文档图像,图像处理,扭曲恢复 作 者: 指导老师: IV Abstract Image warping caused by scanning, photocopying or photographing a document is a common problem