秦存钢_汉字输入法码表的字词应该规范.pdfVIP

秦存钢_汉字输入法码表的字词应该规范.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
秦存钢_汉字输入法码表的字词应该规范.pdf

汉字输入法码表的字词应该规范 秦存钢 20年前GB2312-80的公布、各种汉字输入法和汉字编辑软件的研制成功,使国人乘上了信 息时代的高速列车。这20年来,为了使语言文字工作更好地服务于社会,国家颁布了《国家 通用语言文字法》和一系列语言文字标准,使中文信息处理工作走上了规范化、法治化的轨 道。 我们现在使用的电脑的操作系统,大多是Windows95以后的版本,采用的都是GBK字库。 这套字库共收录了21003个汉字,完全兼容GB2312-80标准,支持国际标准ISO/IEC10646-1和 国家标准GB13000-1中的全部中日韩汉字,并包含了1986年重新发表的《简化字总表》和1988 年公布的《现代汉语通用字表》的全部规范汉字和台湾BIG5编码中的所有汉字。 与字库相联系的是汉字的输入法。字库更新了,输入法也应该根据国家语言文字规范标 准适时地更新,但微软的Windows XP和其他软件公司为我们提供的输入法却还是老面孔,存 在着不少缺陷。 (1)输入法中汉字不全,缺少《简化字总表》(1986年版)里的所列的简化字。 “智能ABC”属GB2312-80输入法,只能输入6763个汉字和由这些汉字组成的词。“全拼”、 “双拼”和“郑码”输入法属GBK输入法,在理论上可以输入GBK字符集中的210003个汉字和 偏旁。可是,Windows9X和Windows2000所提供的这几种输入法,没有一个能把这些字全部输 入。据我们编程统计,郑码输入的字最多,可录入21002字,缺一“敻”字;全拼仅可录入20902 个字缺下列101字: 郎凉秊裏隣兀嗀﨎﨏﨑﨓﨔礼﨟蘒﨡﨣﨤﨧﨨﨩   从以上所举缺字可以看出,在GBK字库中,有些字是重复的。如果说“郞”与“郎”在字 形上还有细微区别的话,那么“凉凉、秊秊、裏裏、隣隣、敻夐”的字形则完全相同,但在 电脑识别中又确实是两个不同的字,如“凉凉”用ASCII码表示,前者是49593(十六进制为 C1B9),后者是64925(十六进制为FD9D)。造成这种情况,不外乎两个原因:一是相同的字 形给予两个码号,造成编码有重复,这是编码的疏忽;二是编码正确,造字时搞错了,这属 于字库问题。 1986年10月10日重新发表的《简化字总表》确认“、、晔、詟、诃、、、刬、 鲙、诓、雠”等11个类推简化字为规范字,不再作为淘汰的异体字。其中“晔、诃、诓、雠” 四个是GB2312-80汉字,GBK字库又新增加了其余七字。但全拼只能输入“詟、鲙、刬”三字; “、、、”是没有的,而与之相对应的繁体字“訢、讌、鰌、紬”倒是能够录入。 真是咄咄怪事! GBK字库比《新华字典》(1998年修订本)的字数多一倍,但《新华字典》收录的字,GBK 字库却没有收,如:“儱、瑽、鑪”的简体字。这给人们的用字带来不便。 (2)词中用字不规范,甚至有的词中还存在别字。 我们在使用拼音输入词语时,经常出现不规范字。1986年,重新发表《简化字总表》时, 对原《简化字总表》中的个别字,作了调整。“叠、覆、像、囉”不再作“迭、复、象、罗” 的繁体字处理。“囉”类推简化为“啰”,“瞭”字读去声时如在“瞭望”中不简作“了”。 GBK字库中是有“啰”和“瞭”的。可是我们要输入“啰嗦、瞭望”等词时,屏幕上却是“罗 嗦、了望”。有人批评这是字库的问题,实际上这是输入法词库的问题。许多输入法的码表 是在GB2312-80字符集的基础上研制的,只支持GB2312-80中的6763字和由这些字构成的词, 到了GBK字库阶段而没有加以适时修订,出现“罗嗦、了望”等词也就不足为怪了。 除了不规范字外,有的词中还有错字。例如用“智能ABC”输入“趋之若鹜”,得到的却 是“趋之若骛”,用“全拼”拼写“好高骛远”,屏幕上却是“好高务远”。文化程度低的 人特别是中小学生发现不了错误所在,以误为正,向其学习,这将贻害无穷。 (3)拼音不规范,按规范读音打不出输入法码表中已收录的字词。 1985年12月27日,国家语委、国家教委和广播电视部联合公布的《普通话异读词审音表》 修改了一部分异读词的读音。如“呆”统读“dāi”,那么“呆板”只能读“dāi bǎn”,不 能再读“áibǎn”。可是,Wi

文档评论(0)

docindpp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档