ocr技术及其应用.pptx

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

OCR技术及其应用

教学课件

1

OpticalCharacterRecognition

文档图像

电子文档

教学课件

2

字符识别的历程

教学课件

3

概念的提出始于1929年

国内的研究从70年代才开始,目前已经达到国际先进水平,其中汉字工作识别技术已经位居国际领先

字符识别的类型

脱机

联机

教学课件

4

银行领域的应用

教学课件

5

税务领域的应用

-3/8224*-32/7302674/17*62+62091**8*

108*-5/++425-0*52

-975*3880029825-

教学课件

6

电子政务领域的应用

教学课件

7

电子公文审批与流转

电子公文的识别与查询

OCR应用的技术组成

图像处理

版面分析

版面还原

格式化输出

字符分割

表格识别

字体识别

语义后处理

字符识别

教学课件

8

图像处理

教学课件

9

去噪声、平滑、去黑边、倾斜校正等

教学课件

10

版面理解

教学课件

11

表格识别

教学课件

12

字符分割

行分割

字分割

教学课件

13

字符识别

教学课件

14

字体识别

宋体

仿宋

黑体楷体隶书魏碑圆体

教学课件

15

语义后处理

先天

中固

光大

图解

本年

水平

印 囤 创

午 固 的中国

经济

发展

教学课件

16

中国的经济发展水平

中 国 触 结

申 围 徘 绪

牛 图 解 络

格式化输出

教学课件

17

目前挑战性的课题

教学课件

18

脱机手写汉字识别

超大字符集的印刷字符识别

非定制版面分析

OCR涉及的模式识别问题

教学课件

19

一致性假设

在统计意义下,一般假设:

样本与分类对象具有同分布。

给定的所有分类对象独立同分布。

样本的分析

教学课件

20

决策对样本空间划分的有效性。

推广能力:决策对分类对象的有效性。

贝叶斯决策理论

教学课件

21

已知的先验概率

需要决策的类别数是一定的

基于模型的方法

人工神经网络

教学课件

22

缺乏充分的理论基础

局部极小点问题

过学习与欠学习的问题

支持向量机

教学课件

23

统计学习理论

一种专门研究小样本统计学习规律的理论

九十年代初取得重要进展

核技术

教学课件

24

可以证明,一定存在一个映射,称为核函数,将在欧式空间定义的样本映射到特征空间(一个更高维的空间),使得在特征空间上,样本构成两个不相交的闭凸集。

研究核函数选择的技术称为核技术。

对比测试

教学课件

25

弱分类器

教学课件

26

如果一个分类器的分类能力(泛化)稍大于50%,这个分类器称为弱分类器。

这意味着,比掷硬币猜正面的概率稍好,就是弱分类器。

集成

教学课件

27

采用投票的方式决定新样本类别。

由于每个分类器的分类能力不同,在集成时,需要对所有分类器加权平均进行分类。

1990年Shapire证明,如果将多个弱分类器集成在一起,它将具有强分类器的泛化能力。

谢谢!

教学课件

28

您可能关注的文档

文档评论(0)

159****1944 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档