语音信号处理.ppt

下载文档 降价啦

36
0
约3.31万字
约 181页
2017-02-16 发布于天津
举报
版权申诉
保障服务

语音信号处理.ppt

1、本文档共181页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

语音信号处理

语音信号处理院定选修课学时：32 学分： 2 信号信息处理的重要研究方向语音信号处理 QQ群：郎文辉电话：3419617 第一章绪论研究对象语音：语言的声学表现。由人的发音器官发出的、具有一定语法和意义的声音。重要性：最重要、最有效、最常用、最方便的信息交换手段。“四会” 语音信号处理：用数字信号处理技术对语音信号进行处理。新兴、综合性、交叉学科；涉及到语言学、声学、认知学、心理学。信号与信息处理的重要组成部分热门学科，存在大量机遇研究内容包括：语音编码－压缩语音合成－计算机讲话读文章语音识别－口授打字机等，翻译关键词识别语音增强说话人识别－“声纹”身份识别。教学内容与目标：课程内容：基本概念的建立；各种理论和算法介绍。教学目标：对语音信号处理有基本了解，为以后的研究工作做储备。发展概况： 39年的声码器用于通讯 40年代后期的语谱仪 60年代的数字模型：《语音产生的声学理论》 70年代的LPC 80年代的VQ以及HMM 90年代的神经元等新技术第二章??语音信号处理的基础知识 2.1 概述本章讨论内容 1、语音产生模型线性模型 2、语音学基本内容信息交流“发音－传递－感知”三个阶段发音语音学－确定发音机理较成熟声学语音学－信号分析理论解释语音现象听觉语音学－认识感知的过程 2.2 语音产生的过程语音是具有一定意义的声音 20-20KHz。经分析：欲表达－选择词、语句－控制肌肉运动－振动空气形成语音波声带是位于喉咙中间的两条白色韧带等效为激励源＋声道＋喇叭口声带开启和闭合使气流形成一系列脉冲。每开启和闭合一次的时间即振动周期称为音调周期或基音周期，其倒数称为基音频率，也简称为基频70-350Hz 等效为激励源＋声道＋喇叭口激励源：声带声带振动频率－基频(基音频率) 清音－声带不振动浊音－声带振动声道：可变谐振腔不同形状、不同音共振(谐振)频率共振峰 Fn的局部最大值，称为共振峰。与声道对应，反映语音的频率特性，是语音的主要特征之一。不同人不同，同一人发不同音时也不同。一般地：语音识别，取前3个共振峰，而对语音合成，需取5个 2.3 语音信号的特性 2.3.1 语言和语音的基本特性语言，特殊的声音，按一定规则排列声音的物理属性音质：基本特征音调：频率音强：量、响度、幅度音长：声音的长短语音特有的属性音节：语音流的最小单位音素：语音的最小单位，音素构成音节感情：重音语调声调等 2.3.2 语音的时间波形和频谱特性看一段实际语音元音其中一段再放大清音 2.3.3 语音信号的统计特性平稳随机过程：随机信号的统计特性与开始进行统计分析的时刻无关。各态遍历的随机过程：如果所有样本在固定时刻的统计特征和单一样本在全时间上的统计特征一致。语音信号可以看作是一个遍历性随机过程的样本函数。对语音信号进行周期性取样得到的取样序列可以看成是离散时间过程的取样序列。语音信号的统计特性：用振幅概率密度函数和一些平均量（主要是均值和自相关函数）来描述。概率密度的估算：根据长时间范围内一段语音信号的大量取样数据的绝对值计算其直方图。 2.4 语音信号产生的数字模型理想模型标准准确但不可能，必近似、简化简单最好用成熟的理论线性模型一个实用模型小结语音的时间波形连续、随机、短时性、基频、清/浊音、共振峰线性模型激励＋声道＋辐射 2.4.1 激励模型根据前节分析，激励源在清、浊音时不同，分别讨论浊音有人测量知，声带振动产生斜三角型脉冲波 2.4.2 声道模型声音在声道的传播涉及到许多物理定律(能量守恒、流体力学)，需简化。有不同的模型。 1、声管模型 “短时”间声道是一个形状稳定的级联管道声音在不同截面积间传输会有反射，反射系数： km＝(Am+1 - Am) /(Am+1 + Am) Am,Am+1是第m、m+1段的截面积 Km是声道的特性，确定Km，就确定了声道！ 2、共振峰模型根据声道近似为谐振腔的特性，有另外模型－模拟其共振峰。3～5个 (2) 并联型对于非—般的元音和大部分辅音，必须采用零极点模型。此时其传输函数为 (2)级联型用并联网络模拟声道。大部分音用零极点模型，转移函数： 2.4.3 辐射模型声道输出的速度波，经口唇变成声压－辐射效应研究得模型R(z)