汉字编码%3a系统、模式的应用.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

汉字编码:系统、模式与应用 李成跃 【提 要】一种“汉字编码系统”,它具有共同的编码模式,统一的拼写代码, 系列编码之间,能够相互演化。它将字词基本属性的拼写描述,作为编码演化的 基础,能够充分满足拼音识字的教学要求。可为汉字编码,扩展一些新的用途。 【关键词】汉字编码 系统 模式 拼音识字 汉字编码,包括计算机内码和外码。外码中的输入编码,具有很多编码样式。 这些编码,它们各自独立,不成体系。假如,我们把这些编码系统化,模式化, 让它们既具有“个性化”,又具有“通用性”,并且,不局限于汉字输入,那么, 这样的汉字编码,将会发生哪些变化? 一、汉字编码系统 本人试图建立一个“汉字编码系统”(1)。 现有的汉字编码,数以千计,它们各具特色,又相互分散。作为编码爱好者, 自然会产生这样的思考:这些独立分散的编码中,哪些编码可以归纳出一个共同 的基础?哪些编码,存在相互联系?能否将那些具有共同基础、相互联系的编码, 排成一个个系列? 或者,更进一步,能否从一个共同的初始编码出发,演化出一个相互联系、 相互演化的编码系列?能否将这些编码系列集合起来,编制一个编码系统? 本人的实践证明,这样的思考,是可行的,是实用的。 为建立“汉字编码系统”,本人做了如下努力? 1、给“汉字编码”一个实用的定义。 汉字编码,就是字词基本属性的拼写形式,这些拼写形式,是用《汉语拼音 方案》拼写的。 这个定义规定: 编码内容,是字词的基本属性。这些基本属性,是最基本的启蒙常识,包括 汉字的读音、笔顺、偏旁部首及其组合等内容。 拼写工具,是《汉语拼音方案》。 2、建立汉字编码“通用模式”。 117 汉字编码,相互之间,如何联系?如何演化?在同一系统中,需要设计一个 共同的编码模式(通用模式)(2)。 汉字编码的“通用模式”的样式是: [汉字编码]=[读音描述’]+[形义特征描述’]+[检索序号] ; 其具体说明,见后面“二、汉字编码通用模式”。 3、定义系统代码。 “汉字编码系统”,使用统一的代码。它们是: (1)、读音代码,描述字词读音和部件名称;用《汉语拼音方案》拼写,或 缩写。 (2)、笔画代码,描述汉字笔画或书写笔顺;横、竖、撇、点、折, 用《汉 语拼音方案》拼写,或缩写。 (3)、声调代码,描述汉语音节的声调;阴平、阳平、上声、去声,用《汉 语拼音方案》拼写,或缩写(阳平声调的缩写,用“平”字的声母“p”表示), 轻声不标,或将声调用数字表示。 (4)、序号代码,描述字词在属性分类中的排列序号,用汉语拼音字母表示, 按字母表排序,或用数字表示,或将字母(或数字)定义相应的数值进制。 汉字部件,有读音的,用读音代码描述;无读音的,用笔画代码描述;也可 以全用笔画代码描述。 4、确定字词基本属性和描述依据。 拼音识字阶段,字词的基本属性,可首选为:读音、笔顺,然后再加入:部 首、偏旁(部件)。 字词读音,按普通话拼写。多读音的,教学用码,以《小学生规范字典》的 注音范围为依据;社会用码,以辞书典籍为注音依据,尽量全面收录。 字形,依据GB18030-2005文件字形。 书写笔顺,有国家标准的,按标准拼写;无标准的,按现有标准类推拼写; 无法类推的,按笔顺的一般原则确定。 部首,据形归部,采用201部。取部方法,参照《如何确定汉字部首》(3)。 部首、偏旁(部件)名称,有读音依据的,用读音称说;无读音依据的,采 用“俗称”。 118 5、建立《汉字属性数据库》。 以《汉字属性数据库》,作为建立“汉字编码系统”的数据载体(基础)。 《汉字属性数据库》,对汉字属性(包括读音、笔顺、部首、部件组合、结构 类型、字形标志等)作全面反映。属性描述中,对没有规范依据和参考依据的字 词属性,一律留出“空缺(空白)”,待有规范依据和参考依据时,再加以补充。 建立“

文档评论(0)

sjatkmvor + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档