多媒体技术基础 - message.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体技术基础 - message.ppt

多媒体技术基础 高放 2003/1 Gaofang@shtvu.edu.cn 多媒体信息的压缩 把冗余的信息去掉 1.空域相关 2.时域相关 3.视觉掩盖效应 指标: 压缩比大 算法简单 恢复效果好 信息压缩的基本原理 冗余压缩法 无损压缩,可逆 熵压缩法 有损压缩, 熵:平均信息量,不可逆 变长编码 1.Huffman编码 信号概率 2.算术编码 出现频率 初始化子区间:[0,1] 新子区间的起始位置=前子区间的起始位置+当前符号的区间左端*前子区间长度 新子区间长度=前子区间长度*当前符号的概率 预测编码 关联性 变换编码 坐标变换 音频信号的压缩编码 音频信号编码基础 时域冗余度 幅度的非均匀分布 样本间的相关 周期之间相关 基音之间相关 浊音、清音 静止系数 长时自相关函数 频域冗余度 非均匀的长时间功率谱密度 语音特有的短时间功率谱密度 人的听觉感知机理 掩蔽效应 不同频段的敏感程度不同 相位变化不敏感 音频信号编码的分类 统计特性 声学参数 听觉特性 音频信号的压缩编码+算法 基本原理 声音信号被编码,经传输与存储,由解码器恢复成原始信号 编码方式分类: 波形编码方法 分析合成方法 混合编码方法 脉冲编码调制 均匀量化PCM A/D采样 非均匀量化PCM 信号振幅小时缩小量化级高度 信号振幅大时增大量化级高度 称为浮点方式量化 μ律 用7位PCM,得到11位量化位 A律 压缩的动态范围略小, 小信号线性,大信号对数压缩特性 线性预测编码 样本时间相关性较强的信号 自适应预测编码 随声音信号的变化 频域编码 自适应变换编码、子带编码 混合型编码 标准及评估 G7.11 G7.21 G7.22 G7.28 MPEG 质量评估 AC3编码和解码 DOLBY(杜比实验室) AC-1应用自适应增量调制(ADM) 把20KHZ的宽带立体声音频信号编码成512Kb/s的数据流。 AC-3提供 五个声道从20-20 KHz的全通带频,L,C,R,LS,RS 100Hz 超低音声道(备用)算0.1,故称为5.1声道。已定为HDTV标准 五、视频图像的压缩编码 分类 JPEG MPEG MPEG 三个部分: MPEG-System MPEG-Video MPEG-Audio MPEG-1 视频信息和伴音信息压缩后的数据速率是1.5M/S 图像识别度 人或机器从图像中抽取有关信息的程度 MPEG-1 视频和伴音信息压缩后的数据速率是1.5M/S MPEG-System 视频信息和音频信息的同步和多路复用 MPEG-Video 视频信息压缩到1.25M/S MPEG-Audio 音频压缩到0.25M/S MPEG-1 将一系列视频画面按一定帧数分成组 帧内画面 预测画面 插补画面 视频质量相当于VHS MPEG-2、-4 MPEG-2:4--20M/S MPEG-4:低码率声-像技术 交互性 高倍压缩 通用的可存取性 灵活性和可扩展性 MPC II MPC III 六、多媒体数据压缩编码国际标准 1、静态图像压缩编码的国际标准(JPEG) 联合图像专家小组(Joint Photographic Experts Group) 2、运动图像压缩的国际标准(MPEG) MPEG(Motion Picture Experts Group) MPEG I: 三个部分: MPEG-System MPEG-Video MPEG-Audio MPEG-1 视频信息和伴音信息压缩后的数据速率是1.5M/S MPEG-System 视频信息和音频信息的同步和多路复用 MPEG-Video 视频信息压缩到1.25M/S MPEG-Audio 音频压缩到0.25M/S MPEG将一系列视频画面按一定帧数分成组 帧内画面 预测画面 插补画面 视频质量相当于VHS MPEG II: 4--20M/S MPEG IV:低码率声-像技术  交互性 高倍压缩 通用的可存取性 灵活性和可扩展性 基于内容的编码 作业:实验要求 1. 将Windows\Media文件夹下的logoff.wav声音放大一倍,然后对其设置淡入淡出效果,将编辑后的声音以单声道方式保存在C:\My Document中。 2. 用Audio Editor的录音功能,录制一段声音(内容自定),声音的格式设定为22.05kHz,8位单声道。以voice.wav保 3. 将myvoice.wav和logoff.wav合成在一起,如

文档评论(0)

kunpengchaoyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档