- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 多媒体信息处理的必要性和可行性 2.1 多媒体信息的特点 2.2 信息压缩的必要性 2.3 信息压缩的可行性 2.4 数据压缩技术的性能指标 练习与思考题 2.1 多媒体信息的特点 多媒体信息主要有三个特征: (1)数据量庞大:和文本信息相比,语音、图像的信息量就显得十分庞大。例如,用生动的语音表达和文本文字相同的一段内容,语音所需要的数据量要比文本大10倍以上。若要用图像来大体表示同样的意思,则图像所需要的数据量又不知道要大多少倍了。 (2) 码率可变、突发性强:代表多媒体信息的数据流其码率是随着不同的信息内容、所处的不同时间而不断变化的。人们讲话时的停顿、所传场景图像中物体的运动等都会形成码流速率的波动,而且这种波动往往呈现出极强的突发性。再加上采用了种种信息压缩编码的方法,就更加剧了这种变化。 (3) 复合性信息多,同步性、实时性要求高:多媒体通信系统中传输的往往是两种或两种以上媒体的复合信息,各类信息之间存在着很强的关联,因此,对信息传输的同步性及实时性的要求相当高。 2.2 信息压缩的必要性 1. 图像或视频信号 以彩色电视信号为例,设代表光强、色彩和色饱和度的YIQ空间中各分量的带宽分别为4MHz、1.3MHz和0.5MHz。由采样定理,仅当采样频率≥2倍的原始信号的频率时,才能保证采样后的信号可被保真地恢复为原始信号。 2. 语音信号 人在正常说话时的音频一般在200Hz~3.4kHz,即人类语音的带宽为3.4 kHz。同样依据采样定理,并设数字化精度为8bit,则每秒的数据量为 3.4 kHz×2×8=54.4 kbit 在上述采样条件下讲一分钟话的数据量约为400kbit。 表2.2-1列出了支持语音、图像、视频等多媒体信号高质量存储和传输所必需的未压缩速率以及信号特性。 未进行编码和压缩:窄带语音信号需要128kb/s的速率,即两倍于普通电话的速率。宽带话音需要256kb/s的速率,双声道立体声CD音频需要1.41 Mb/s的速率。 在保持原始信号质量的前提下压缩:窄带语音4kb/s(30∶1的压缩比),宽带话音16kb/s(15∶1的压缩比),CD音频64kb/s(22∶1的压缩比)。 2.3 信息压缩的可行性 数据中通常包含很大的冗余,数据的大小与所携带的信息量的关系由下式给出: I=D-r (2.3-1) 其中I,D,r分别为信息量、数据量与冗余量。以存储一本200万字的中文百科全书为例,每个汉字以2字节计算,该书的数据量为4MB。若使用Huffman算法,就可简单地将大约2MB左右的冗余数据寻找出来并压缩掉,这样就可以节省出2MB的存储空间。 1. 空间冗余 在任何一幅图像中,均有许多灰度或颜色都相同或相近的邻近像素组成的局部区域,它们形成了一个性质相同的集合块, 即它们之间具有空间上的强相关性,表现为空间冗余。 2. 时间冗余 时间冗余是活动图像和语音数据中经常包含的冗余。活动图像中的两幅相邻的图像有较大的相关性,这反映为时间冗余。同理,在语音中,由于人在说话时其发出的音频是一个连续和渐变的过程,而不是一个完全的时间上独立的过程, 因而存在着时间冗余。 利用这种时间冗余,可实现数据压缩。这种压缩对运动图像往往能得到很高的压缩比,这也称为时间压缩或帧间压缩。 3. 信息熵冗余(编码冗余) 所谓熵就是平均信息量。 5. 知识冗余 人们通过认识世界而得到某些图像所具有的先验知识和背景知识,由此带来的冗余称为知识冗余。如人脸的图像有固定的结构,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正脸图像的中线上等等。这类规律的结构可由先验知识和背景知识得到, 因此这类信息对一般人来说是冗余信息。 6. 视觉听觉冗余 以视觉为例,人类的视觉系统并不能对图像画面的任何变化都能感觉到,视觉系统对于图像场的注意是非均匀和非线性的,即注意主要部分质量
文档评论(0)