汉字编码标准中的类推简化.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉字编码标准中的类推简化.doc

类推技术标准 说一说汉字编码技术标准中的类推简化 引言 随着《通用规范汉字表》发布,一场宣传已经展开,随之也有一些争论出现。争论中一个重要问题,或焦点性问题:是应该实行有限制的类推,还是无限制的类推?这个问题不仅仅是语言文字学里的理论性争论,它密切关联着电脑的实际使用。实际上,此次的《字表》已经继续类推出一批电脑汉字编码中没有的汉字,即新造了一批电脑外字,160余个。这将带来一系列不良后果。由于汉字编码技术标准是新事物,其产生历史不过仅仅三十多年,又具有较强的技术性,领导机构管理者、广大公众对其了解较少。本文将对此做简要但也是较为完整的介绍。 文字编码技术标准的产生 世界上最早的文字计算机编码技术标准是ISO646—1973(约40年前)。这是一个关于拉丁字母文字的国际编码标准。编码的字符包括拉丁字母、数码以及标点等其他符号,总计94个可见图形字符,及一些起控制作用符号共计128个,占用7位二进制位。此标准的前身是美国国内的编码技术标准,1960年代的版本中只有大写字母,没有小写字母;后来补充大写字母,又被称为ASCII字符集。这个ISO646或者说是ASCII字符集,成为世界信息技术界最重要的技术标准。它决定了拉丁字母文字信息的表达、存储、加工、以及传输,保障了一大批西方文字、科技语言、程序语言在全球范围的电子化流通。这个信息化的、电子化的字符集,取代了历史久远,在工业时代、机械化时代成功广泛应用的,以纸质印刷形式为主的‘字母表’,成为文字规范的新形式、新手段。以此为基础的英文信息处理电脑化的成功,极大地刺激了、推动了世界各国文字处理技术的电脑化浪潮。 中国汉字编码技术标准的初期,简化字无限制类推阶段 中国的第一个汉字计算机编码技术国家标准是GB2312—1980(刚刚33年)。这是在国际性文字处理电脑化浪潮初起时期的一项开创性工作。主持者是一位比王选还年轻十来岁的青年技术工作者。该标准的语言文字学依据,自然靠向语文学家请教,遵循了当时语文界的主流认识。它不包含任何一个繁体字。这个标准并不完美,甚至还有错字出现。但正是这个标准的适时推出,保障了中国汉字电脑化浪潮有了一个可用的基础,对汉字的电脑化迅猛但有序的发展作出了重大贡献,曾经被授予科技重奖。这个国家标准GB2312—1980,收字仅仅6763个,不包含任何繁体字。标准实施过程中,同时设计了五个称为‘辅助字符集’的编码标准,总计约四万余汉字,以实现对汉字文献的完整表达。其中,第二、第四辅助集,是经过无限制类推简化得到的,不包含任何繁体字。而第一、第三、第五辅助集,是与前者并立的繁体汉字系统集,其中不包含任何简化字。这种思路,自然来自当时语文界的主流认识。其政策依据是《简化字总表》的说明(1964年5月)。在类推简化字表的说明中指出:“汉字总数很多,这个表不必尽列。”表中未列出的字,在实际使用中需要用到时,“凡用第二表的简化字或简化偏旁作为偏旁的,一般应该同样简化”。 简、繁体两个并立的六个编码字符集为什么没有获得应用? 上述六个编码字符集,除了基本集外的那五个,基本没有怎么投入应用,也少为人知。原因可能是:把汉字区分为并立的、或平行的两个独立系统的认识不符合实际,不符合潮流。人们发现:在中华古籍印刷中,并非需要一律地、完全地翻译成现代白话(一律用简化字);而用繁体字印刷时,那辅助集二、四根本没有用。实际上是白白地类推简化出两个编码字符集。1980年代,汉字电脑化潮流迅猛、神奇、精彩。那些说‘汉字字量大、结构复杂的无法克服的缺点’的认识,已经大大地失去了市场。就连著名汉字改革家周有光先生,在他那‘简化十戒’中也说“简化常用字好;简化罕用字不好”,明确地不再支持无限制地类推简化。台湾的繁体字系统,及大陆的简化字系统,同样成功地、精彩地实现了电脑化。简繁体汉字电脑处理效率几乎完全没有什么差异。这使越来越多的人相信中华民族新的书同文终将到来。周有光先生欣然题词“书同文是21世纪必须实现的目标”。这就使得基本集、二辅助集、四辅助集联用的、彻底的、完整的简化字方案失去了群众基础和社会基础。 放弃无限制类推、具有简繁体共存优点的编码标准产生 1980年代初期汉字电脑化浪潮,迅猛、神奇、精彩。这让国人重新燃起汉字复兴、民族新的书同文的梦想。1986年,中央高层决定把‘文字改革委员会’更名为‘语言文字工作委员会’,同时提出: “今后,对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对稳定,以利于社会应用”。这实际上给停止无限制类推提供了政策依据。由于文字处理技术产品的广大市场,特别是迅速发展的中国市场,吸引了西方信息产业巨头及国际标准化组织关注,而汉字问题是其中的一个重要关键。这给中国联合台、港、澳专家与日、韩专家合作研制简、繁体汉字,中、日、韩汉字兼容的编码技术标准提供了机会。这

文档评论(0)

hdhca0884 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档