语音信号处理.ppt

  1. 1、本文档共181页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理

语音信号处理 院定选修课 学时:32 学分: 2 信号信息处理的重要研究方向 语音信号处理 QQ群: 郎文辉 电话:3419617 第一章 绪 论 研究对象 语音:语言的声学表现。由人的发音器官发出的、具有一定语法和意义的声音。 重要性:最重要、最有效、最常用、最方便的信息交换手段。“四会” 语音信号处理:用数字信号处理技术对语音信号进行处理。 新兴、综合性、交叉学科;涉及到语言学、声学、认知学、心理学。 信号与信息处理的重要组成部分 热门学科,存在大量机遇 研究内容包括: 语音编码-压缩 语音合成-计算机讲话读文章 语音识别-口授打字机等,翻译 关键词识别 语音增强 说话人识别-“声纹”身份识别。 教学内容与目标: 课程内容: 基本概念的建立; 各种理论和算法介绍。 教学目标: 对语音信号处理有基本了解,为以后的研究工作做储备。 发展概况: 39年的声码器用于通讯 40年代后期的语谱仪 60年代的数字模型:《语音产生的声学理论》 70年代的LPC 80年代的VQ以及HMM 90年代的神经元等新技术 第二章??语音信号处理的基础知识 2.1 概述 本章讨论内容 1、语音产生模型 线性模型 2、语音学基本内容 信息交流“发音-传递-感知”三个阶段 发音语音学 - 确定发音机理较成熟 声学语音学 - 信号分析理论解释语音现象 听觉语音学 - 认识感知的过程 2.2 语音产生的过程 语音是具有一 定意义的声音 20-20KHz。 经分析: 欲表达- 选择词、语句- 控制肌肉运动- 振动空气形成语音 波 声带是位于喉咙中间的两条白色韧带 等效为激励源+声道+喇叭口 声带开启和闭合使气流形成一系列脉冲。每开启和闭合一次的时间即振动周期称为音调周期或基音周期,其倒数称为基音频率,也简称为基频70-350Hz 等效为激励源+声道+喇叭口 激励源:声带 声带振动频率-基频(基音频率) 清音 - 声带不振动 浊音 - 声带振动 声道:可变谐振腔 不同形状、不同音 共振(谐振)频率 共振峰 Fn的局部最大值,称为共振峰。与声道对应,反映语音的频率特性,是语音的主要特征之一。不同人不同,同一人发不同音时也不同。 一般地:语音识别,取前3个共振峰,而对 语音合成,需取5个 2.3 语音信号的特性 2.3.1 语言和语音的基本特性 语言,特殊的声音,按一定规则排列 声音的物理属性 音质:基本特征 音调:频率 音强:量、响度、幅度 音长:声音的长短 语音特有的属性 音节:语音流的最小单位 音素:语音的最小单位,音素构成音节 感情:重音 语调 声调等 2.3.2 语音的时间波形和频谱特性 看一段实际语音 元音 其中一段再放大 清音 2.3.3 语音信号的统计特性 平稳随机过程:随机信号的统计特性与开始进行统计分析的时刻无关。 各态遍历的随机过程:如果所有样本在固定时刻的统计特征和单一样本在全时间上的统计特征一致。 语音信号可以看作是一个遍历性随机过程的样本函数。对语音信号进行周期性取样得到的取样序列可以看成是离散时间过程的取样序列。 语音信号的统计特性:用振幅概率密度函数和一些平均量(主要是均值和自相关函数)来描述。 概率密度的估算:根据长时间范围内一段语音信号的大量取样数据的绝对值计算其直方图。 2.4 语音信号产生的数字模型 理想模型标准 准确 但不可能,必近似、简化 简单 最好用成熟的理论 线性模型 一个实用模型 小结 语音的时间波形 连续、随机、短时性、基频、清/浊音、共振峰 线性模型 激励 + 声道 + 辐射 2.4.1 激励模型 根据前节分析,激励源在清、浊音时不同,分别讨论 浊音 有人测量知,声带振动产生斜三角型脉冲波 2.4.2 声道模型 声音在声道的传播涉及到许多物理定律(能量守恒、流体力学),需简化。有不同的模型。 1、声管模型 “短时”间声道是一个形状稳定的级联管道 声音在不同截面积 间传输会有反射, 反射系数: km=(Am+1 - Am) /(Am+1 + Am) Am,Am+1是第m、m+1段的截面积 Km是声道的特性,确定Km,就确定了声道! 2、共振峰模型 根据声道近似为谐振腔的特性,有另外模型-模拟其共振峰。3~5个 (2) 并联型 对于非—般的元音和大部分辅音,必须采用零极点模型。此时其传输函数为 (2)级联型 用并联网络模拟声道。大部分音用零极点模型,转移函数: 2.4.3 辐射模型 声道输出的速度波,经口唇变成声压 - 辐射效应 研究得模型R(z)

文档评论(0)

ailuojue1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档