字符集编码ANSI和UNICODE.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
字符集编码ANSI和 UNICODE 编码指不同国家的语言在计算机中的一种存储和解释规范 ANSI 与ASCII n 最初,Internet 上只有一种字符集——ANSI 的ASCII 字符集(American Standard Code for Information Interchange,“美国信息交换标准码),它使用7 bits来表示一个字符,总共表示128 个字符,后来IBM 公司在此基础上进行了扩展,用8bit 来表示一个字符,总共可以表示256个字符, 充分利用了一个字节所能表达的最大信息 nANSI字符集:ASCII 字符集,以及由此派生并兼容的字符集,如:GB2312,正式的名称为MBC (Multi-Byte Chactacter System,多字节字符系统),通常也称为ANSI 字符集。 UNICODE与UTF8,UTF16 n 由于每种语言都制定了自己的字符集,导致最后存在的各种字符集实在太多,在国际交流中要经常 转换字符集非常不便。因此,产生了Unicode 字符集,它固定使用16 bits (两个字节)来表示一个 字符,共可以表示65536个字符 n标准的Unicode称为UTF-16(UTF:UC Transformation Format )。后来为了双字节的Unicode 能够在现存的处理单字节的系统上正确传输,出现了UTF-8,使用类似MBC 的方式对Unicode 进行编码。(Unicode字符集有多种编码形式) 例如“连通”两个字的Unicode标准编码UTF-16 (big endian)为:DE 8F 1A 90 而其UTF-8编码为:E8 BF 9E E9 80 9A n 当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字符集的哪种编码 保存的。软件一般采用三种方式来决定文本的字符集和编码: 检测文件头标识,提示用户选择,根据一定的规则猜测 最标准的途径是检测文本最开头的几个字节,开头字节Charset/encoding,如下表: EF BB BF UTF-8 FE FF UTF-16/UCS-2, little endian FF FE UTF-16/UCS-2, big endian FF FE 00 00 UTF-32/UCS-4, little endian. 00 00 FE FF UTF-32/UCS-4, big-endian.

文档评论(0)

tianya189 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体 阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档