金融票据OCR系统票据和字符的切分与识别汇编.pdfVIP

金融票据OCR系统票据和字符的切分与识别汇编.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
金融票据OCR系统票据和字符的切分与识别汇编.pdf

作者: 于武贵 学位授予单位: 北京邮电大学 相似文献(10条) 1.学位论文 魏锋 金融票据OCR系统中关键技术的研究 2002 该论文是对作者研究生期间对票据OCR关键技术研究的总结. 分别在手写数字串的切分方法研究和手写数字识别方法研究上取得了一定的成果. 第一章概述, 主要讨论了票据OCR的背景和现状, 解释了票据OCR的各项技术, 以及该论文的主要成果; 第二章是对手写数字串切分算法研究的总结, 首先分析了手写数字串切分的难点及目前研究状况, 然后重点介绍了五种切分方法 , 并提出了四次切分的程序结构, 并对上下边缘特征在切分中的应用进行了单独的讨论; 第三章, 手写数字识别算法部分, 主要围绕基于神经网络的识别算法和基于支撑向量机的识别算法两大部分展开, 介绍了两种算法的原理, 总结了对两种算法的研究结果, 最后利用这两种算法提出了小写数字的识别核心框架; 第四章是票据OCR内核的设计, 属于程序设计的内容, 主要是为了对 象化等目的, 对票据处理代码进行集成和模块话, 借助COM的思想, 把内核以对象的形式, 用统一的接口类提供给外部使用, 文中说明了设计思路, 列出了接口类和代码实体类以及实例化方法. 2. 学位论文 徐蔚然 基于统计分类器的银行票据自动处理系统若干关键技术研究 2003 该文的研究目的就是参考国内外必威体育精装版研究进展, 在PRIS实验室的技术积累基础之上, 在银行票据OCR系统中的成套关键技术 的国家863项目的支持下, 对银行票据OCR系统系统中的关键技术进行研究和改进, 从而提高系统的整体性能. 该文主要开展了以下几方面的研究. 银行票据中的待识别文字既可能是印刷体文字, 也可能是手写体文字, 为了获得高精度识别结果, 需要把 两种文字区分开. 该文从特征提取, 特征选择和分类器设计等方面对该问题进行分析, 用贝叶斯分类器和神经网络设计了两种字体判断方法. 当训练样本充足时, 用神经网络正确率可达到99.5﹪, 拒识率为3﹪时, 错误率即可降低到接近0的程度. 当训练样本很少时, 用贝叶斯分类器,6个训练样本的正确率可以达到89.96﹪,99个训练样本的正确率为98.59﹪. 为了处理银行票据中不 同识别域的二值化问题, 该文从对知识的获取和利用的角度讨论选择和构造二值化方法的思路, 并针对各类识别域具体构造了一整套二值化方法. 文字切分不仅是票据识别系统中的重要关键技术, 也是其它所有脱机文字识别技术实用化的瓶颈. 该文的文字切分方法主要有以下三个特点:(1) 切分之前先提取候选切分位置.(2) 采用贝叶斯分类器确定最佳候选切分边界.(3) 结合文 字识别结果切分文字. 在银行票据OCR中的许多关键技术都和文字识别结果可信度相关. 该文提出一种新的基于支持向量机的易混淆字判别和可信度估计方法, 该方法适用于任何种类的分类器. 3.期刊论文 刘刚 . 张洪刚 . 郭军 用于脱机手写数字识别的隐马尔可夫模型 - 计算机研究与发展 2003,40(8) 将隐马尔可夫模型(HMM)用于脱机手写数字识别中, 系统如何建模是一个值得研究的问题 . 在考虑手写数字自身特点及特征抽取的基础上, 对HMM模型的训练方法及模型参数的选取进行了研究, 以提高系统识别率 . 在银行票据OCR的应用中, 与基于神经网络的方法结合使用, 使得整张票据的拒识率降低了3%,明显提高了银行票据OCR系统的性能 . 4. 学位论文 郑瑞虹 语音及字符识别中若干问题的研究 2003 字符识别和语音识别是模式识别中的两个重要领域. 该文就这两个领域的某些问题做了一些研究. 语音识别方面: 该文通过对语言模型、声学模型和识别器的研究构筑了一个基于HMM的大词汇量非特定人的汉语连续语音识别系统, 该系统具有很强的可移植性、实时性和较好的识别效果. 字符识别方面: 主要是对手写数字训练样本的挑选和E13B码可信度这两个方面的研究 . 该文对训练样本进行了分类, 给出了边界样本的定义, 同时指出适当的添加边界样本到训练样本中对识别器性能的提高是有益的. 同时该文给出一个规则, 在计算机根据这个规则来自动的挑选训练样本, 并且调整训练样本的分布. 通过在银行票据OCR系统中的实际应用, 证明这种方法是有效的. 另外, 该文提出一种新的字符识别结果可信度的测定方法. 该方法以各候选字的相对 邻近

文档评论(0)

肖四妹学教育 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档