第二讲-视频压缩基础.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲-视频压缩基础

空域预测 一边编码,一边解码, 在解码当先像素之前,如果相邻像素已经解码完,那么就可用来预测当前像素的值! 一副图像被分成若干块,以块为单位做编解码,严格按照某种次序编码 * Decoded pixels 时域预测 编码端很容易得到相邻图像,但解码端如何得到呢? 同样的,在编码当前图像之前先解码相邻图像 图像按照一定顺序编码和解码 * 编码 解码 residual - = Decoded Frame 1 Decoded Frame 1 问题 当编码某个图像块时,即可以用空域预测方法得到其预测值,也可以用时域预测法得到,到底应该用哪种方法预测呢? * Decoded Frame 1 一些基本概念 Video sequence GOP Picture Slice Macroblock Block * 总结 用于生成预测值的图像块和图像分别叫作参考块和参考图像 在编码某个图像块之前,它的参考图像和参考块需要先被解码,用解码后的像素值作为参考像素值 否则如果用原始像素值作为参考像素值会有什么后果呢? * 变换技术 * 为什么要变换? 变换后,系数的值更集中,便于做压缩,例如: 同时在频率域上对图像块进行了分解,便于应用人眼对高频分量不敏感的视觉冗余特性 * 一个自然图像的变换 * 总结 通过数学变换矩阵将图像块变换为另外一种表达形式,方便做压缩 Y=X*T, X:图像块 T:变换矩阵 Y:变换后的图像块表达 如果T可逆,则X=T-1*Y,在解码端可以恢复图像块X T可以有多种形式,不同的T,就产生了不同的变换方法:DCT,KLT, Hadamard,… * 量化 量化是降低数据表示精度的过程,通过量化可以减少需要编码的数据量,达到压缩数据的目的 例如:x’=(x/q)*q 但是,量化会引起失真 如果能利用人眼的视觉冗余特性,进行合理量化,使失真对人眼视觉的影响尽量小 * 量化步长对码率和失真的影响 * 像素域量化和频率域量化 实验: 输入x = [100 110 120 130 140 150 160 170] 做一维DCT:y=[381.8377, -64.4232, 0.0, -6.7345, 0.0, -2.0090, 0.0, -0.5070] 分别用6,20,100为量化步长做像素域量化和频域量化 量化步长为6时 * 当量化步长为20时 * 当量化步长为100时 * 总结 量化步长控制着码率和失真的平衡 频域量化的性能好于像素域 * 熵编码 统计冗余的消除主要通过熵编码来实现。利用信源的信息熵进行码率压缩的编码方式称为熵编码 基本思想:为出现概率大的符号分配短码字,为出现概率小的符号分配长码字,从而达到总体平均码字最短。 编码对象概率分布越不均匀,熵编码的效率越高 两种基本方法 哈夫曼编码:每个值分配一个码字,每个值至少要用一个比特表示 算术编码:用一个浮点数代表一串值 * 哈夫曼编码实例 * 算术编码举例 Input sequence “1321” Termination: Encode the lower end (0.7712) to signal the end. * 总结 不管是哪种熵编码方法,基础都是概率模型,即编码对象的概率分布 为了提高压缩效率,应尽量使概率分布不均匀,例如变换,条件概率等 应该根据概率模型选择合适的熵编码方法 * 环内滤波 由于在解码端只能用解码图像作为参考,进行时空域预测,因此预测性能和解码图像质量密切相关 分块DCT和量化会引入块效应,降低解码图像质量和预测效率 对解码图像进行滤波有助于消除块效应,提高预测效率 * 滤波前 滤波后 视频编码框架 * 解码框架 * 内容提要 为何要进行视频压缩? 为何视频能被压缩? 如何进行视频压缩? 如何评价视频压缩性能? * 码率 在视频实时播放过程中,平均每秒消耗的比特数 码率 = 编码比特数/播放时长=编码比特数/(总帧数/帧率)bps * 失真 解码图像相对于原始图像的差异 主要是由于量化引起的 * 客观失真度量 客观质量的评价算法有均方差(Mean Square Error, MSE),信噪比(Signal Noise Ratio, SNR),峰值信噪比(Peak Signal Noise Ratio, PSNR)等,其中最常用的是PSNR。PSNR 的数学表达式为: 其中,MSE 表示原始图像和解码图像像素间的均方差,n 为表示图像像素值所用的比特数,通常n=8。PSNR 的单位是分贝(dB)。 当解码图像的PSNR 值较高时表示其客观质量较高,相反,PSNR 值较低时表示其客观质量较低 当PSNR=0时,表示失真为零 PSNR 值的高低并不能完全表示图像实际质量的高低,图像的主观质量

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档