计算机编码介绍.ppt

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机编码介绍

几种常用编码的介绍 第*页 第*页 第*页 * 一、base64编码 二、Quoted Printable编码 三、UTF8 编码 四、GB2312编码 Base64是一种传输编码; 是为了适应将任何计算机数据都表示成便于 显示和排版的字符串; Base64中的64个字符是: “ABCDEFGHIJKLMNOPQRSTUVWXYZabc defghijklmnopqrstuvwxyz+/0123456789” Base64编码-介绍 2的6次方等于64。 因为base64只有64个可用字符,所以它编码后 的每个字节只能表示6个bit的信息内容; 我们待编码的内容是8个bit的,所以就造成了编 码以后的数据比原来的数据要长; 6和8的最小公倍数是24,故base64的最小编码 单元是24bit,四个字符。 Base64编码-介绍 Base64编码-举例 例如我们要对字符串“123”编码: “123”对应的16进制数为:0x31 0x32 0x33; 表示成二进制数表示如下: 00110010 将二进制数每6位分成一组表示如下: 001100 010011 001000 110011; 每6位分段后得到的四个数字分别是:12 19 8 51 在base64编码表中查表对应的字符: M T I z 所以字符串”123”编码后是“MTIz” Base64编码-特例 例如我们要对字符串“12312”编码: “123”对应的16进制数为:0x31 0x32 0x33 0x31 0x32; 表示成二进制数表示如下: 0011001000110001 将二进制数每6位分成一组表示如下: 001100 010011 001000 110011 001100 010011 001000; 注意: 因为原始字符串不是3的倍数,分出来后最后一组缺两位,需要补零。 每6位分段后得到的七个数字分别是:12 19 8 51 12 19 8 在base64编码表中查表对应的字符: M T I z M T I 不够一个6位分组单元的补0,不够一个编码单元(4个字节)的补“=”号,编码后的字符串是”MTIzMTI=“ Base64编码-其他 base64编码后的数据只能出现base64里面的64个字符、用于补齐的‘=’号和回车换行符。 回车换行必须出现在4的整数倍个字符后,‘=’只能出现在每4个字符单元的最后一个或最后两个。 举例: EFH/ABC= HIaCAB== ABCDA+/=ABC= ABC A===,A=BC,AB=C Quoted printable编码 Outlook翻译为:“括上的可打印项目” 这个编码非常简单,但是数据冗余量非常大。 例如将“123”进行编码: “123”对应的16进制数分别是0x31 0x32 0x33 编码后的字符串为”=31=32=33” 编码后数据的长度是编码前数据长度的3倍,是一种非常简单但很不经济的一种编码方法。 UTF-8编码-背景 UTF-8意思是Universal Transformation Format 通用转换格式; UTF-8用1-6个字节编码Unicode字符,用在网页上可以同一个页面显示中文简体、繁体及其他语言,称为万国码。 ASCII字符集 1-128 大小写英语字符、数字、标点、换行制表控制等; ASCII扩展字符集 128-255 一些欧洲文字,拉丁字母 Unicode字符集:所有字符用两个字节表示,高字节为零的表示ASCII字符集内容,高字节不是零的代表了其他语言里的字符,如汉语、日语、韩语、越南语等。 UTF-8编码-产生原因 因为Unicode表示ASCII字符时不经济:一个字符用两个字节表示,且主机间传输时存在字节序的问题:x86平台和ppc平台不一样,0xAABB怎么解析需要约定。所以出现了一种中间格式的字符集,称为通用转换格式,有UTF-7、-7.5、-8、-16、-32等。 UTF-8编码-转换方法 128以内:Unicode=UTF-8; 128-2047:00000xxx xxxxxxx -110xxxxx 10xxxxxx 2048-65535: xxxxxxxx xxxxxxxx-1110xxxx 10xxxxxx 10xxxxxx 65536-2097151: 000xxxxx xxxxxxxx xxxxxxxx- 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 2097152

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档