数字音视频原理-许方敏-05b-音频压缩.pptVIP

数字音视频原理-许方敏-05b-音频压缩.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MUSICAM — 心理声学模型 基于NMR进行感知比特分配 NMR越小的子带,应分配更多的比特数 * * 第一步,频谱分析 时域变换到频域,长度为 N=512或者1024 的 FFT 运算 在低频范围内,多相滤波器组的频率分辨力不够 有限数量 32 个子带 恒定带宽 750Hz (取样频率为 48 Khz) 1024 点 FFT 补偿子带滤波器的频率分辨率 48 Khz 取样时,频率分辨率是 46.875Hz FFT 的计算 加一个汉宁窗 对 X(i)*h(i) 求 FFT 的频域声音信号 X(k) k = 0.....N/2 求得功率谱密度 P(k) = 10lg|X(k)|2 (dB) FFT 和多相滤波器组的联合使用 既有高的时间分辨率(多相滤波器),以确保短的冲击信号质量 又有高的频率分辨率(FFT),以适应稳态信号,实现尽可能低的数据率 MUSICAM — 心理声学模型 MUSICAM — 心理声学模型 第二步:定位单音(类似正弦波)和非单音信号(类似噪声) 单音和非单音信号产生的掩蔽效应不同; 单音:局部最大点; 单音能量: 非单音能量,除了单音以外的 * MUSICAM — 心理声学模型 第三步:使用绝对掩蔽门限 小于绝对掩蔽门限的单音和非单音都被忽略 第四步:分别计算掩蔽门限 利用掩蔽扩散函数Zb 第五步:计算全局掩蔽门限: * * MUSICAM —动态比特分配 32 个子带的比特分配均以各子带 SMR 为基础计算 首先确定可用于样值编码的有效比特数 等于可用比特总数减去比特分配本身所需比特数和附加信息的比特数: adb = cb - (bbal + banc) 附加信息 比例因子; 比例因子选择信息 比特分配信息 帧头 差错保护 辅助数据 比特分配是一个循环过程 使整个一帧和每个子带的总噪声掩蔽比最小 所用比特数不能超过一帧所能提供的最大数目 开始,先计算各子带的掩蔽噪声比 MNR = SNR - SMR SMR 是心理声学模型的输出 SNR 可查表求得 * 初始化 声音样点的比特数置为 bspl = 0 ; 比例因子的比特数置为 bscf = 0 ; 比例因子选择信息的比特数置为 bsel = 0 ; 计算所有子带的 MNR 最小值 提高有最小 MNR 的子带的量化精度 重新计算 bspl、bscf、bsel,得新的剩余比特数 adb = cb - (bbal + bsel + bscf + bspl +banc) 重新计算该子带的 MNR 返回步骤 c,直到 adb < 0 为止 比特分配信息的编码 Layer I 每个子带的比特分配信息用 4bit 编码 Layer II 只在低频段用 4bit,中频段用 3bit,而高频段用 2bit。 MUSICAM —动态比特分配 * MUSICAM—子带样值的量化和编码 Layer I 有 n = 14 个量化比特 ,有 2n-1 个量化等级 这对于各个子带都是相同的 没有分配给比特的子带就不被量化 每个子带样值由一个码字独立编码 Layer II 量化级数随子带的不同而不同 但量化等级仍然覆盖了从 3~65535 的范围,同时子带不被分配给比特的可能性增加了 低频段的量化等级有 15 级,中频段 7 级,高频段只有 3 级。 相继的三个子带样值被组合成一个“颗粒”,用一个码字编码,编码增益可达37.5%。 * MPEG1 Layer II 上述各个部分举例 (码率为 128Kb/s) 原始声音信号(1152 个样值点) 全局掩蔽门限,声压级(dB) * 信号掩蔽比 (SMR,dB) 比特分配 MPEG1 Layer II 上述各个部分举例 (码率为 128Kb/s) * 重建的 SPL 误差 (dB) MPEG1 Layer II 上述各个部分举例 (码率为 128Kb/s) * MUSICAM-比例因子的取值和编码 子带信号的动态范围较大,如直接量化,当信号电平较低时,噪声就显现出来。 为充分利用量化器动态范围,将每子带 12 个(8ms)相继的样值归

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档