第二讲-视频压缩基础.pptVIP

下载本文档

16
0
约4.34千字
约 49页
2018-05-03 发布于浙江
举报
版权申诉

第二讲-视频压缩基础.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二讲-视频压缩基础

空域预测一边编码，一边解码，在解码当先像素之前，如果相邻像素已经解码完，那么就可用来预测当前像素的值！一副图像被分成若干块，以块为单位做编解码，严格按照某种次序编码 * Decoded pixels 时域预测编码端很容易得到相邻图像，但解码端如何得到呢？同样的，在编码当前图像之前先解码相邻图像图像按照一定顺序编码和解码 * 编码解码 residual - = Decoded Frame 1 Decoded Frame 1 问题当编码某个图像块时，即可以用空域预测方法得到其预测值，也可以用时域预测法得到，到底应该用哪种方法预测呢？ * Decoded Frame 1 一些基本概念 Video sequence GOP Picture Slice Macroblock Block * 总结用于生成预测值的图像块和图像分别叫作参考块和参考图像在编码某个图像块之前，它的参考图像和参考块需要先被解码，用解码后的像素值作为参考像素值否则如果用原始像素值作为参考像素值会有什么后果呢？ * 变换技术 * 为什么要变换？变换后，系数的值更集中，便于做压缩，例如：同时在频率域上对图像块进行了分解，便于应用人眼对高频分量不敏感的视觉冗余特性 * 一个自然图像的变换 * 总结通过数学变换矩阵将图像块变换为另外一种表达形式，方便做压缩 Y=X*T， X：图像块 T：变换矩阵 Y：变换后的图像块表达如果T可逆，则X=T-1*Y，在解码端可以恢复图像块X T可以有多种形式，不同的T，就产生了不同的变换方法：DCT，KLT， Hadamard，… * 量化量化是降低数据表示精度的过程，通过量化可以减少需要编码的数据量，达到压缩数据的目的例如：x’=（x/q）*q 但是，量化会引起失真如果能利用人眼的视觉冗余特性，进行合理量化，使失真对人眼视觉的影响尽量小 * 量化步长对码率和失真的影响 * 像素域量化和频率域量化实验：输入x = [100 110 120 130 140 150 160 170] 做一维DCT：y=[381.8377, -64.4232, 0.0, -6.7345, 0.0, -2.0090, 0.0, -0.5070] 分别用6，20，100为量化步长做像素域量化和频域量化量化步长为6时 * 当量化步长为20时 * 当量化步长为100时 * 总结量化步长控制着码率和失真的平衡频域量化的性能好于像素域 * 熵编码统计冗余的消除主要通过熵编码来实现。利用信源的信息熵进行码率压缩的编码方式称为熵编码基本思想：为出现概率大的符号分配短码字，为出现概率小的符号分配长码字，从而达到总体平均码字最短。编码对象概率分布越不均匀，熵编码的效率越高两种基本方法哈夫曼编码：每个值分配一个码字，每个值至少要用一个比特表示算术编码：用一个浮点数代表一串值 * 哈夫曼编码实例 * 算术编码举例 Input sequence “1321” Termination: Encode the lower end (0.7712) to signal the end. * 总结不管是哪种熵编码方法，基础都是概率模型，即编码对象的概率分布为了提高压缩效率，应尽量使概率分布不均匀，例如变换，条件概率等应该根据概率模型选择合适的熵编码方法 * 环内滤波由于在解码端只能用解码图像作为参考，进行时空域预测，因此预测性能和解码图像质量密切相关分块DCT和量化会引入块效应，降低解码图像质量和预测效率对解码图像进行滤波有助于消除块效应，提高预测效率 * 滤波前滤波后视频编码框架 * 解码框架 * 内容提要为何要进行视频压缩？为何视频能被压缩？如何进行视频压缩？如何评价视频压缩性能？ * 码率在视频实时播放过程中，平均每秒消耗的比特数码率 = 编码比特数/播放时长=编码比特数/（总帧数/帧率）bps * 失真解码图像相对于原始图像的差异主要是由于量化引起的 * 客观失真度量客观质量的评价算法有均方差(Mean Square Error, MSE)，信噪比(Signal Noise Ratio, SNR)，峰值信噪比(Peak Signal Noise Ratio, PSNR)等，其中最常用的是PSNR。PSNR 的数学表达式为：其中，MSE 表示原始图像和解码图像像素间的均方差，n 为表示图像像素值所用的比特数，通常n=8。PSNR 的单位是分贝(dB)。当解码图像的PSNR 值较高时表示其客观质量较高，相反，PSNR 值较低时表示其客观质量较低当PSNR=0时，表示失真为零 PSNR 值的高低并不能完全表示图像实际质量的高低，图像的主观质量