网站大量收购闲置独家精品文档,联系QQ:2885784924

第一章文档图像预处理概述 - read.doc

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章文档图像预处理概述 - read

目录 摘要: 3 第一章 文档图像预处理概述 5 1.1 文档图像处理系统介绍 5 1.2 文档图像预处理 6 1.2.1 彩色图像转换为灰度图像,以及灰度图像的二值化 6 1.2.2 图像方向的自动检测与倾斜校正 7 1.2.3 版面结构理解 8 参考文献 10 第二章 传统的图像阈值化方法介绍 11 2.1 图像分割与图像阈值化概述 11 2.2 全局阈值选取方法 12 2.2.1 直方图与直方图变换方法 12 2.2.2 最大类间方差法(ostu方法) 14 2.2.3 最小误差法 15 2.2.4 概率松弛法(Relaxation) 16 2.2.5 最大熵方法 17 2.2.5.1 Shannon关于熵的定义 18 2.2.5.2 Pun的最大熵方法 18 2.2.5.3 Kapur,Sahoo和Wong的方法 20 2.2.5.4 Abutaleb的二维熵算法 20 2.2.5.5 Pal和Bhandari的条件熵方法 22 2.3 局部阈值方法与动态阈值选取 25 2.3.1 Chow和Kaneko的方法 27 2.3.2 Yanowitz和Bruckstein的方法 27 2.3.3 Sauvola和Pietik?inen的方法 28 参考文献 30 第三章 改进的算法:直接局域二值化方法 31 3.1 问题的提出 31 3.2 对问题的分析及解决方案的提出 33 3.3 直接局域二值化方法 33 3.3.1 将图像划分成为子区域 34 3.3.2 使用改进的条件熵方法进行阈值化 36 3.4 算法效果比较 42 参考文献 45 第四章 总结与展望 46 致谢 47 摘要: 作为信息的最重要载体,电子文档处理的研究引起人们极大的兴趣。在任何文档处理系统中,预处理极为重要,其效果好坏会严重地影响其它模块的工作。特别是灰度图像二值化效果的好坏,对识别效果以及其后的一切处理都有相当大的影响。原因之一是,任何物理传感输入都是灰度图像,文档处理系统的大多数模块却仅仅处理二值图像,图像二值化是必不可少的。此外,图像二值化本身也是数字图像处理中重要的基本问题。 本文首先介绍完整的文档处理系统以及其预处理模块,然后将重点放在二值化问题上,给出图像阈值化方法的综述,并对全局阈值化、局部动态阈值化等方法的优点和缺点给出评价。本文尤其针对灰度变化比较复杂的文档图像,提出了一种改进的动态阈值化算法,并以仿真实验与以往的全局方法进行了比较,证实所发展新方法的优势。本文对该新算法在具体应用中会遇到的问题也做了估计,并提出解决相应问题的基本原则。 关键词:预处理,灰度图像,二值化,阈值 Direct Local-thresholding Method for Gray-level Document Images Abstract: People have great interest in the study of document processing, as electronic document is the most important information carrier nowadays. In any document processing system, pre-processing plays an important role in that it affects all the later modules in the system. Among various pre-processing, gray-level image to binary- image conversion, or image binarization is a key. First, an image obtained with a sensor is essentially a grey-level image, but most modules in the processing system only deal with binary image, and binarization becomes a necessity. Second, binarization has it’s own basic research interest. In this thesis, we first introduce the full document processing system and its preprocessing part; then we give special attention to the problem of binarization, and make a survey of various exis

文档评论(0)

yanchuh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档