语音信号及单片机处理 教学课件 作者 吴黎明 主编 王桂棠 吴正光 副主编 第二章.pptVIP

语音信号及单片机处理 教学课件 作者 吴黎明 主编 王桂棠 吴正光 副主编 第二章.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
平均幅度差函数能够代替自相关函数进行语音分析,是基于这样一个事实,即语音的浊音具有准周期性(设周期对应的样点数为N)。如果信号是完全的周期信号,则相距为周期倍数的样点上的幅值是相等的,差值为零,即 而实际的语音信号,d(n)虽然不为零,但值仍很小。这些极小值将出现在整数倍周期的位置上。 定义2.5短时平均幅度差函数 当窗函数{}和{}为矩形窗,且窗长分别为N和N+k时,有 这样计算Fn (k)只需加、减法和取绝对值的运算,与自相关函数的相加和相乘运算相比,其运算量大大减小,尤其是在硬件实现语音信号分析时有很大好处。为此,AMDF已被用在许多实时语音处理系统中。 2.7 计算机中音频的存储 音频文件通常分为两类:声音文件和MIDI文件。 声音文件:指的是通过声音录入设备录制的原始声音,直接记录了真实声音的二进制采样数据,通常文件较大。 MIDI文件:它是一种音乐演奏指令序列,相当于乐谱,可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件尺寸较小。 (1)WAVE文件——*.WAV Wave文件使用三个参数来表示声音:采样位数、采样频率和声道数。在计算机中采样位数一般有8位和16位两种,而采样频率一般有11025HZ(11KHz),22050HZ(22KHz)、44100Hz(44KHz)三种。以单声道为例,则一般WAVE文件的比特率可达到88K~704Kbps。 具体介绍如下: WAVE格式是Microsoft公司开发的一种声音文件格式,符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。 Wave格式支持MSADPCM、CCITT A Law、CCITT μ Law和其它压缩算法,支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式。但其文件尺寸较大,多用于存储简短的声音片段。 (2)AIFF文件——AIF/AIFF AIFF是音频交换文件格式(Audio Interchange File Format)的英文缩写,是苹果计算机公司开发的一种声音文件格式, 被Macintosh平台及其应用程序所支持,Netscape Navigator浏览器中的LiveAudio也支持AIFF格式,SGI及其它专业音频软件包同样支持这种格式。 AIFF支持ACE2、ACE8、MAC3和MAC6压缩,支持16位44.1Kz立体声。 (3) Audio文件——*.AUDIO Audio文件是Sun Micosystems公司推出的一种经过压缩的数字声音格式,是Internet中常用的声音文件格式。 Netscape Navigator浏览器中的LiveAudio也支持Audio格式的声音文件。 (4)MPEG文件——*.MP1/*.MP2/*.MP3 MPEG是运动图像专家组(Moving Picture Experts Group)的英文缩写,代表MPEG标准中的音频部分,即MPEG音频 第*页 第二章 语音时域分析 2.1 语音分析处理概述 2.2 语音信号的数字化和预处理 2.3 语音信号的加窗处理 2.4 短时平均能量与短时平均幅度 2.5 短时平均过零率 2.6 短时相关分析 2.7 计算机中音频的存储 2.1 语音分析处理概述 1876年贝尔发明的电话,首次用声电转换技术实现了远距离的语音传输。 1939年Dudley研制成功第一个声码器,奠定了语音产生模型的基础,在语音信号处理领域具有划时代的意义。 1947年贝尔实验室发明了语谱图仪,将语音信号的时变频谱用图形表示出来,为语音信号分析提供一个有力工具。 1948年美国Haskins实验室研制成功“语图回放机”,把手工绘制在薄膜片上的语谱图自动转换为语音,并进行语音合成,共振峰合成方法就是源于这一思想。 语音处理系统包括: 语音通信 语音识别 语音合成 前提和基础:是语音信号的分析: 语音分析就是从语音信号中抽取表现其本质的特征参数的语音处理技术,只有分析出表现语音信号本质的特征参数,才有可能利用这些参数进行高效的语音通信,才可能建立用于识别的模板或知识库以及语音合成的语音库。语音识别率的高低、语音合成音质的好坏,都取决于对语音信号分析的准确性和精度。 2.2 语音信号的数字化和预处理 语音分析全过程的是短时分析技术。 由于语音在一个短时间范围内的物理特征与频谱特征近似不变,具有短时平稳特性,即语音信号是一种准平稳过程,因此可以把语音的分析和处理建立在短时分析技术的

您可能关注的文档

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档