一个基于神经网络在线汉字识别外文翻译.docxVIP

一个基于神经网络在线汉字识别外文翻译.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一个基于神经网络在线汉字识别外文翻译

A.2 译文一个基于神经网络在线汉字识别现有一个基于神经网络在线汉字识别的系统(OLCCR)。在此提出了一种反向传播神经网络系统,它用来解决系统中的模式匹配问题,而不是那些非神经网络算法。这个OLCCR系统将使我们能够实时识别手写汉字。每一个认识的过程包括两个主要阶段:(A)特征提取阶段,其中一个特征向量信息的基础上参考行程可以提取,和(B)字匹配阶段,其中一个特征向量与匹配组标准的中文参考字符特征向量。实验结果表明,大约需要0.25秒来识别手写字符,可以达到约91%的识别率。1、简介最近,在人工神经网络模型中产生出大量的有关此领域的演讲和模式识别。一个典型的神经网络模型包含了许多平行非线性计算的元素,这些元素在模式中紧密相连,这会使人联想到生物学的神经网络。Hopfield [l], Rumelhart et al. [2], Sejnowski and Rosenberg [3],Feldman and Ballard [4], Carpenter and Grossberg [5], and Kohonen [6] 近期的工作在一定程度上导致了这个领域研究的复苏。在过去的二十年里,许多科学家致力于手写汉字字符识别的研究。像在许多统计模式识别的问题一样,最困难的任务是提取特征向量和开发分类(聚类)算法。因为其转移不变性和循环不变性的性能,一套使用笔画分析的功能最近变得很受欢迎。在本文中,提出了一种基于OLCCR系统的BP神经网络来对手写汉字实时识别的相关问题进行探讨,并期待对未来的研究提出可行的改进。2、回顾BP神经网络模型在1969年,Minsky和Papert提出了一种BP技术用来解决信贷分配问题。一个BP神经网络系统就是一个位于输入层和输出层之间的一个或多个层次的隐藏的单位组成的前馈网络。图一显示的就是包含两个隐藏的层次的一个BP神经网络。它是由许多处理部件(PU)组成,在这些处理部件中暗中输入了非线性变换的线性组合。从图二可以看出,第i个PU的输入可以等效于单层次的神经网络如下: (1) 其中是第j层输入和第i个PU之间的差值。 它的传递函数可以表示为: (2)一个多层感知器网络中的隐藏单位可作为特征探测器使用,用来反映输入节点和输出装置之间的映射关系,并且以此来克服单层网络的局限性。然而,在一个多层网络中,该部位的形成就像那些混合形成的分布分类器的加权一样复杂。同时,训练的问题是更加复杂的。误差信号在许多突出的不同层次形成。因为隐藏层的隐藏性质,其中的误差信号无法直接计算。由于缺少有效地学习算法,多层网络不被广泛使用。最近,这个通过一个被称为广义三角洲规则的互动的梯度学习过程算法发生了改变(附录1,根据要求提供)。该算法是在输出设备上基于误差的一种配方,目的是调整连接权。这些误差会在通过隐藏层到输入层的过程中滞后,在那里根据输出单元中期望值和实际值之间的差异根据增量调整权重,并将之迭代,直到所有投入产出模式双相匹配为止。因此,这个新技术已经广泛用来有效地解决许多复杂的和确定性的问题,如XOR问题,语音合成和肯定及模式识别。图1 含两个隐藏层的BP网络示意图 图2 第i个PU的输入等效的单层神经网络3、基于网络的神经OLCCR系统的构架如图3所示,OLCCR的神经网络已经在手写汉字的实时识别中得到了使用。如图4a的例子中所示,在每一个认识过程中,一个手写数字字符识别系统是由输入到笔迹数据点的数字化。预处理过程使这些数据点变稀少变平滑。这个使其稀少的过程就是通过比较原数据点和之后的数据点之间的差异后消除一些不必要的数据点来完成。然后,无论(或)或(或)的时候,否则就丢弃。必须足够大,可以消除数据冗余点,必须足够小,可以足以保存本质的特征。平滑的过程即遵循变稀少后的数据点进一步消除噪音。由和来确定第k个平滑点。图4b中给出,,和的示例。因此,我们的OLCCR系统的两个主要单元得以实施。图3 OLCCR系统框图手写字符输入字符图片预处理特征提取模式匹配特征数据库识别后的字符输出(A)特征提取单元链码上常用的就是手写字符[12,13]的字符。链码的使用与分割可能涉及到人类的辨认和书写字符中的一个最基本的机制。人类视觉和感觉上的研究表明本地特色的出现比在人类相对位置的视觉感知中更占主导地位。在我们的工作中,一个输入字符的特征提取是指总笔画的数目和笔画的类型标识的序列。笔画识别的四项主要工作是(1)分割,(2)流向,(3)尖端检测,(4)笔画类型:图4 手写汉字特征(a)原型(b)平滑细化处理(c)分割后(1) 轨迹曲率是最明显的特点。Freeman通过利用预处理后的数据点生成的量化方向提出了一个有用的近似曲率。基于Hanaki的递归方法,手写的数字[14]的每一个笔画都近似为一些线段。在每个笔画中,一个数据点代表从起始点到

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档