第六章 汉字输入技术.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 汉字输入技术

第六章 汉字输入技术 内容 汉字输入技术概述 汉字键盘输入技术 汉字键盘输入系统 Windows汉字输入技术 Linux下的汉字输入系统 一、汉字输入技术概述 内容 汉字输入发展史 汉字输入分类 汉字输入技术发展和应用 1、问题提出 早期,计算机主要通过键盘输入文字信息 在计算机出现以前,西文打字机的键盘早已定型,计算机很自然地利用了打字机键盘这一录入工具。 在键盘上没有汉字,那么如何才能将汉字输入到计算机中? 2、大键盘方案 设计一个汉字大键盘。这个汉字大键盘上有几千个按键,每个按键对应一个汉字,汉字按照偏旁部首在键盘上分区排列,以便于快速检字。 大键盘的思想经过实践证明是失败的,它存在的问题主要是在键盘上找字困难,不能输入键盘上没有的汉字,设备本身价格太高等。 3、基于西文键盘的汉字编码输入 这是到目前为止最成功的计算机汉字输入方法。 汉字编码输入是最早的汉字输入方法,已知最早的计算机汉字编码输入始于20世纪50年代的俄汉机器翻译研究,但只能用电报码或四角号码做汉字编码。 在大陆,1978年5月上海电工仪器研究所部工程师支秉彝创造了一种“见字识码”法,并被上海市内电话局采用,从而率先使计算机的汉字输入进入了实用阶段。 在港台及海外,以“王安三角”为发端,陆续涌现出“仓颉”、“呒虾米”、“行列”、“唯物”等一大批繁体汉字输入法。 进入80年代后,在联想汉字、四通中文电脑打字机之后中国的汉字编码出现了“万马奔腾”的局面。在大陆涌现出了五笔、自然码、郑码、拼音、智能ABC、智能狂拼、纵横等上千种的输入法。 4、语音输入 用了多年的键盘输入方式,在1997年左右突然受到猛烈的冲击,各大厂商包括IBM、微软、摩托罗拉、中自、紫光等公司纷纷推出自己的非特定人语音输入系统或者连笔字手写输入系统。 美国微软公司于1997年9月在北京推出中文非特定人连续语音识别系统ViaVoice。ViaVoice是目前在市场上占据统治地位的语音输入系统。 5、手写体汉字识别输入 通过书写汉字记录信息已经有几千年的历史,这也是使用汉字的中国人的普遍习惯,所以手写识别输入是符合中国人记录信息习惯的。 在1997年以后就已经有基本实用的手写汉字识别输入系统,其中佼佼者为中自公司的“汉王99”、摩托罗拉公司的“慧笔”和清华紫光公司的“紫光笔”等。 6、印刷体汉字识别输入 我国对印刷体汉字识别(简称OCR,Optical Character Recognition)的研究始于70年代末80年代初,经过科研人员几十多年的辛勤努力,印刷体汉字识别技术的发展和应用,已经有了长足进步。 清华大学电子工程系、中国科学院计算所智能中心、北京信息工程学院、沈阳自动化研究所等单位分别研制开发出实用化的印刷体汉字识别系统。 清华大学电子工程系研制的清华TH-OCR产品,占据着最大的市场份额,代表着中文OCR技术发展的潮流。 内容 汉字输入发展史 汉字输入分类 汉字输入技术发展和应用 1、分类 汉字的输入两大类: 编码输入 自然输入 语音识别输入 字形识别输入 手写体识别输入 印刷体识别输入 2、键盘编码输入 键盘编码输入首先把需要输入计算机的所有汉字用键盘上的若干个按键编码,这些按键组成的序列称为对应汉字的输入码。通过在键盘上输入某个按键序列,并由计算机中的输入系统把这个序列转换为对应的汉字,从而达到输入汉字的目的。 优点:输入快速、无需添加额外设备 缺陷:输入方式和人们使用语言文字的习惯不符、用户需要化额外的时间学习等。 3、语音识别输入 汉字语音识别输入利用产生声音的物理模型,通过语音分析手段,预先将一些语音的特征提取出来,并存储在处理系统中。当语音信号输入时,处理系统根据对该信号所提取的特征参数和所存储的参考特征进行比较,通过逻辑判断方法和“距离”测量法对语音进行识别。 3、语音识别输入(续) 自然界的声音和人讲话的语音,都是模拟信号,不能直接输入计算机,因此在语音输入的过程中,我们必须通过语音卡(声卡)等设备,把模拟的语音信号转换为数字语音信号输入计算机。然后计算机利用程序对输入的数字语音信号进行统计、判断和识别,并最终把它翻译成计算机能够理解的汉字的内码信息。 语音识别输入技术有着广阔的应用前景 缺点:由于不同人的口音差别较大,语音的准确识别比较困难 4、汉字识别输入 汉字识别输入根据模式识别原理,通过汉字的字形信息识别,产生汉字的内码,实现汉字的识别输入。汉字识别输入的原理是通过抽取代表未知汉字模式本质的表达形式与预先存储在计算机中的标准汉字的模式表达形式的集合逐一进行匹配,用一定的准则进行判别,找出最接近输入汉字的那个标准汉字。 汉字识别输入技术可分为印刷体汉字识别输入和手写体汉字识别输入两大类 。 5、手写体汉

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档