基于形状字符识别算法.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于形状字符识别算法

基于形状字符识别算法   摘 要: 现有基于字符形状的识别算法依赖其他辅助方法识别字符,对此提出改进。采用背景赋值描述字符的凹凸性特征,提出凹凸对称性和凹凸区域夹角的计算方法作为补充,充分利用字符的凹凸性特征设计多级分类器,完全采用凹凸性特征进行多级分类识别,正确识别25个大写英文字符和10个阿拉伯数字,不受字符大小与倾斜影响。实验结果表明,在此提出的改进算法克服了现有算法缺陷,扩展了凹凸性特征的可区分范围,突出了基于形状的算法的优越性。   关键词: 字符识别; 形状特征; 凹凸性特征; 凹凸对称性; 凹凸区域夹角   中图分类号: TN919?34; TP391 文献标识码: A 文章编号: 1004?373X(2013)16?0077?04   0 引 言   字符特征的提取是字符识别中的关键技术。目前应用较为广泛的是提取字符轮廓特征为主的方法,如采用链码描述字符线条、平面曲线及区域边界等[1?3]。此类方法可以较好地提取景物的轮廓,但对于字符大小、倾斜等因素较为敏感,因此需要经过归一化、倾斜校正和细化等预处理。这些处理过程较为繁琐,特别是细化过程,无论是并行算法[4]或是模板匹配算法[5],最终获取理想的单像素图像非常困难,对于字符的准确识别造成不利影响。文献[6?7]所提基于字符形状的识别算法,根据字符的整体形状特征,如字符的凹凸性,提取字符特征,不受字符大小、倾斜的影响,省去归一化、倾斜校正和细化处理,提高字符识别的速度,是一类较为简单、实用的方法。   采用以字符凹凸性特征提取为主的方法识别字符,简单易行。但在分类识别时,需用辅助方法,如文献[6]使用弯曲度计算提取直线特征,文献[7]使用链码描述提取直线和角点等。这些辅助方法除了需要额外的处理时间之外,实际上仍受到字符大小、倾斜等因素的影响。文献[6]所提算法在字符笔画弯曲度计算中,会受到字符倾斜的影响;文献[7]提出的算法,链码描述直线特征需将字符细化。   对此,本文提出采用新的字符凹凸性特征分析与提取方法,针对25个大写英文字符(不包含“I”)及10个阿拉伯数字(0~9),探讨该种方法的可行性及优势。   1 字符形状的凹凸性描???   字符形状的凹凸性特征指字符呈现于人眼的凹凸曲直性。字符的凹凸性特征描述有多种方法[8?10],本文采用背景赋值法。首先逐像素扫描图像并选择背景点(像素值为1),从该像素向其8邻域方向作射线,判断射线是否与图像前景点(像素值为0)相交,将有交点的射线数作为背景值赋值给当前背景点。图1(a)所示的图案进行背景赋值后得到图1(b)所示的赋值背景图像。根据背景赋值,可实现对字符的凹凸性特征描述。   图1(b)中,背景值为8的区域表示该区域的点向8个方向所做射线均与前景点相交,即该点被字符的笔划包围,为圈区域,如图1(a)中的L1、L2。背景值为5~7的点则处于字符笔划的凹陷区,为凹区域,如图1(a)中的LC、RC、UC、DC。显然,不同字符呈现的凹凸性特征具有明显的区别,且抗变性强。   本文采用圈区域数量、凹区域数量及方向、圈区域的大小、凹凸对称性、凹凸区域夹角、凹凸区域位置和宽高比共7个特征识别字符。   2 凹凸性特征提取   (1)圈区域L   如上所述,背景赋值为8即认为是圈区域。但在实践中发现如Arial等部分字体,由于笔划包裹性较强,字符中存在凹陷较深的区域,简单地按照背景赋值法赋值则会将其凹区域的边缘赋值为8,导致圈区域的误判。如图2(a)所示字符“6”。   为避免该问题出现,增加了二次赋值步骤,即对于赋值为8的像素,还要检测其8邻域是否在圈内,将不在圈内的像素赋值为9,认定其为凹区域,如图2(b)所示。   (2)凹区域C   图1(a)中存在4个特征不同的凹区域,为加以区别,做如下定义:   左凹LC:左侧无字符笔划的凹区域;   右凹RC:右侧无字符笔划的凹区域;   上凹UC:上方无字符笔划的凹区域;   下凹DC:下方无字符笔划的凹区域。   (3)圈的大小LV   有圈的字符较多,显然圈的大小可作为重要特征区别不同字符。如D、O为大圈,4、R为小圈。定义LV为圈区域面积与字符面积之比,若LV0.7为大圈,而LV5;而直角凹区域中总会找到一点满足CA=5 ;在不含锐角/直角的凹区域则找不到这样的像素。   (6)凹凸区域位置CP   定义CP0.5则表示凹凸区域在图像的下半部分。   (7)宽高比CR   字符0和O可用宽高比区别,设若CR0.75对应O。   3 实验结果与分析   通过对35个字符的凹凸性特征提取和分析,设计多级分类器,每级使用一项或几项特征条件,将字符逐级分类识别。在VC6.0环境中,针对大量包含常见字体的32×32

文档评论(0)

189****7685 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档