- 1、本文档共2页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
HUFFMAN鼬技术邮研究
摘要:现代社会每天产生海量级的信息,而这些信息的存储和传输需要大量的存储空间,信息本有很大的的冗
余度,因此信息必须采用压缩技术处理。Huffman编码是一种流行而又高效的无损编码,利用Huffman编码就可能比普
通的编码方法使用的码数少,提高了编码的有效性。
关键词:Huffman编码;最优二叉树;无损压缩
Huffman编码根据消息出现概率的分布特性进行统计,寻找概率与码字长度间的最优匹配,利用数据的统计冗余
进行压缩,基于符号出现概率的不同赋予长短不一的码字,出现概率越大的符号,相应的码越短;出现概率越小的符号,
其码越长。算法用一串二进制位(称作位码)来代替每个字符,再将这些位码写进压缩后的文件。利用位码压缩的关键
之处是选择最优二叉树,在Huffman树中没有一个位码是另一个位码的前缀,每一个字符都在树的叶子结点中出现。
Huffman编码一般用来压缩多媒体信息,如文本、程序文件和特色的图像等,实现对数据的无损压缩。解码时,
在消息和码字之间找到明确的一一对应关系,恢复时能准确无误地再现出来,完全恢复原始数据而不引起任何失真。
1编码步骤
Huffman编码是一种一致性编码法,以Huffman树即带权路径长度最小的二叉树构建变长最佳编码,其步骤如下:
(1)将信源符号按其出现的概率,由大到小顺序排列;
(2)将两个最小的概率的信源符号进行组合相加,并重复这一步骤,始终将较大的概率分支放在上部,直到只剩
下一个信源符号且概率达到1.0为止;
(3)对每对组合的上边一个指定为1,下边一个指定为0;
(4)画出由每个信源符号到概率1处的路径,记下沿路径的1和0;
(5)对于每个信源符号都写出1、0序列,就得到非等长的Huffman码。
2Huffman编码设计
例如要压缩字符串“abaadffbghadffda”,首先统计各字符出现的概率:
a:5/16,b:2/16,d:3/16,f:4/16,g:1/16,h:1/16
上述原字符的二it制编码为0110001001100001011001100110011101100001011001100110011001100100共128bito
构造Huffman树,树从最下层的结点开始构造,选取概率最小和次小的两个符号作为左右子树构造一棵新的二叉
树,新二叉树根结点的权值为其左右子树根结点权值之和。重复这一过程,最后得到一个横放的码树即Huffman树。
Huffman编码就是将从根结点出发到叶结点的路径上各左、右分支的编码顺序排列就得到了该叶子结点所对应的
字符的二进制前缀编码,每个字符转换为一个唯一的二进制位串,则该字符串中每个字符的Huffman编码为:a:11,
b:011,d:00,f:10,g:0100,h:0101
原字符串的Huffman编码为:11011111100101001101000101110010100011,共38bit。
3Huffman编码分析
(1)压缩比
压缩比是压缩前后所需的信息存储量之比,上面的例子中可以计算出压缩比为:38/128=30%,所以说Huffman
编码在数据压缩中的压缩效果是非常好的,只要Huffman编码表基于大量概率统计,其编码效果是足够好的。
(2)时间空间效率高
Huffman编码是最佳变长码,得到的是最短的编码长度,有效节省空间。
(3)Huffman编码是无失真的数据压缩编码,解码之后可以无失真的恢复原信息。
(4)Huffman编码的实现方法有很多,比如说ATLAB实现,C语言实现等。
4Huffman编码不足
(1)Huffman编码要精确统计出每个符号出现的概率,通常要进行两次扫描:第一遍扫描产生统计结果,第二次
扫描完成编码,所以编码速度相对慢。
(2)Huffman编码只能用整数来表示单个符号而不能用小数。
(3)只有当信息源各符号
您可能关注的文档
- 2026高考英语 译林版选修2词汇复习全套教案(学生版+解析版) .pdf
- 2026高考语文一轮复习 文言文阅读——文言文断句 .pdf
- 2026高考语文一轮复习 新闻阅读——分析新闻的文体特征和主要表现手法 .pdf
- 2026高考语文一轮复习 标点符号 .pdf
- 2026高考语文一轮复习 语言表达连贯 .pdf
- 317家建企取得环保工程专业承包一级资质.docx
- 4 比 练习课(第1~3课时)教案 人教版数学六年级上册 .pdf
- 500KV变电站用防晕金具研究分析 .pdf
- 7 数学广角 植树问题练习课(第1~3课时) 教案 人教版数学五年级上册.docx
- Benton视觉保持测验.docx
- Unit 1 Hello!第1课时 Cartoon time(学习任务单)英语译林版三起三年级上册.docx
- Unit 1 Making new friends 第2课时 Discover(分层作业)英语人教大同版三年级上册 .pdf
- Unit 1 Making new friends 第3课时 Develop &Explore (分层作业)英语人教大同版三年级上册 .pdf
- Unit 1 Sports Topic Talk(分层作业)英语北师大版2024八年级上册.docx
- Unit 1 Sports 课时 4 Lesson 3(分层作业)英语北师大版2024八年级上册.docx
- Unit 1 Sports 课时3 Lesson 2(分层作业)英语北师大版2024八年级上册 .pdf
- Unit 1 Sports课时2 Lesson 1(分层作业)英语北师大版2024八年级上册.docx
- Unit 2 Amaing numbers 课时2 Section 1-3 Listening and Speaking(分层作业).docx
- Unit 2 Amaing numbers 课时5 Section 4 Focusing culture,Cross-curricular connection,Project(分层作业) .pdf
- Unit 2 Yummy,yummy food Let's have fun!~ Let's explore! (分层作业)新交际英语二年级上册 .pdf
文档评论(0)