信息论基础课件2.2.5.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息论基础课件2.2.5

* 前几节我们讨论了各类离散信源及其信息熵。实际的离散信源可能是非平稳的,对于非平稳信源来说,其 不一定存在,但可以假定它是平稳的,用平稳信源的 2.2.5信源冗余度及信息变差 最后,可以假定是等概分布的无记忆离散信源,用最大熵 来近似。 来近似。然而,对于一般平稳的离散信源,求 值也是极其困难的。那么,进一步可以假设它是m阶 马尔可夫信源,用m阶马尔可夫信源的平均信息熵Hm+1来近似。如再进一步简化信源,即可假设信源是无记忆信源,而信源符号有一定的概率分布。这时,可用信源的平均自信息量H1=H(X) 来近似。 由此可见,由于信源符号间的依赖关系使信源的熵减 小。它们的前后依赖关系越长,信源的熵越小。当信 源符号间彼此无依赖、等概率分布时,信源的熵才达 到最大。也就是说,信源符号之间依赖关系越强,每 个符号提供的信息量就越小。每个符号提供的平均自 信息量随着符号间的依赖关系长度的增加而减少。为 此,我们引进信源的冗余度(也叫剩余度或多余度) 来衡量信源的相关性程度。 对于一般平稳信源来说,极限熵为 ,这就是说,如果我们要传送这一信源的信息,理论上来说只需要有传送 的手段即可。但实际上我们对它的概率分布不能完全掌握, 如果把它近似成m阶马尔可夫信源,则可以用能传送 的手段去传送具有 的信源,当然这里面就不太经济。我们定义信源熵的相对率为信源实际的信息熵与同样符号数的最大熵之比: 定义 为信源的冗余度。 由冗余度的定义可见,信源的冗余度能够很好地反映信源输出的符号序列中符号之间依赖关系的强弱。冗余度 越大,表示信源的实际熵 越小,表明信源符号之间的依赖关系越强,即符号之间的记忆长度越长;反之,冗余度越小,表明信源符号之间的依赖关系越弱,即符号之间的记忆长度越短。 当冗余度等于零时,信源的熵就等于极大熵 ,表明信源符号之间不但统计独立无记忆,而且各符号还是等概分布。因此,冗余度可以用来衡量信源输出的符号序列中各符号之间的依赖程度。 例1:以符号是英文字母的信源为例,英文字母加上空格共有27个,则最大熵为 但实际上,用英文字母组成单词,再由单词组成句子时,英文字母并不是等概率出现,比如我们知道在英语中E出现的概率大于Q出现的概率。对在英文书中各符号的概率加以统计,可以得出各个字母出现的概率, 0.001 Z 0.0175 P 0.054 R 0.001 J,Q 0.021 M 0.055 I 0.002 X 0.0225 F,U 0.059 N 0.003 K 0.023 C 0.063 A 0.008 V 0.029 L 0.0654 O 0.0105 B 0.035 D 0.072 T 0.011 G 0.047 H 0.105 E 0.012 Y,W 0.052 S 0.2 空格 概率 符号 概率 符号 概率 符号 27个英文符号出现的概率 由此得出第一级近似为无记忆信源的熵: 再考察英语的结构得知,要组成有意义的单词,英文 字母的前后出现是有依赖关系的,当前面某个字母出 现后,后面将出现什么字母,并不是完全不确定的, 而是有一定的概率分布。例如字母T后面出现H、R的 可能性较大,出现J、K、L、M、N的可能性极小,而 根本不会出现Q、F、X。也就是说英语字母之间有强 烈的依赖性,而上述序列仅考虑了字母出现的概率, 完全忽略了这种依赖关系。 因此可知,在信源所输出的序列中依赖关系越复杂,信息熵就越小。实际上,英文信源的信息熵还要小 得多,一般认为, 。因此,信息效率和冗余度为 这说明用英文字母写成文章时,有71%是由语言结构、实际意义等确定,而剩下只有29%是写文字的人可以自由选择的。这也就意味着在传递或存储英语信息时,只需要传送或存储那些必要的信息,而有关联的则可以大幅度地压缩。例如100页的英文书,大约只要存储29页就可以了,其中的71页可以压缩掉,这压缩掉的文字完全可以根据英文的统计特性来恢复。信源的冗余度正是表示这种信源可压缩的程度的。 从提高传输信息效率的观点出发,总是希望减少或去掉冗余度。如发中文电报时,为了经济和节省时间,总希望在原意不变的情况下,尽可能地把电文写得简洁些。也就是说,实际的通信系统中,为了提高传输效率,往往需要把信源的大量冗余进行压缩,这就是所谓的信源编码 但是,冗余度也有它的用处,因为冗余度大的消息 具有强的抗干扰能力。当干扰使消息在传输过程中 出现错误时,我们能从上下关联中纠正错误。例如 我们收到“

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档