- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
II 语音信号的产生模型 语音产生模型 主要内容 2.1 语音信号的产生模型 2.2 语音的感知 2.3 语音学基础知识 语音产生模型(1) 2.1 语音的产生 语音产生模型(2) 语音产生模型(3) 语音产生模型(4) 语音产生模型(5) 在声学上对均匀无损耗的管道的声学特性有非常简单的数学描述。 均匀:截面积不变; 无损耗:不考虑声波在管内的热损耗、粘滞摩擦损耗和管壁的热传导作用。 在此基础上,可以将声道简化成一些截面积不等的均匀无损声管的级联。用该模型来逼近真实的声道,称之为声道的时间离散模型。 语音产生模型(6) 语音产生模型(7) 语音产生模型(8) 语音产生模型(9) 语音产生模型(10) 语音产生模型(11) 语音产生模型(12) 语音产生模型(13) 语音产生模型(14) 语音产生模型(15) 语音产生模型(16) 语音产生模型(17) 语音产生模型(18) 语音产生模型(19) 语音的感知(1) 2.2 语音的感知 语音的感知(2) 正常人耳能感知的频率范围为20Hz~20KHz;强度范围为0dB~120dB。 音调是人耳对不同频率声音的一种主观感觉。单位为Mel,与频率近似的满足方程: 语音的感知(3) 语音的感知(4) 掩蔽效应 指在一个较强的声音附近,相对较弱的声音将不被人耳觉察。强音称为掩蔽者,弱音称为被掩蔽者。分为同时掩蔽和异时掩蔽 。 语音的感知(5) 异时掩蔽又分为前掩蔽和后掩蔽两种 一般后掩蔽可持续100 ms,而前掩蔽仅持续20 ms。 语音的感知(6) 各种不同的掩蔽效果 (1)纯音调信号间的掩蔽 语音的感知(7) (2)宽带噪声对纯音调的掩蔽 语音的感知(8) (3)窄带噪声对纯音调的掩蔽 语音的感知(9) 中心频率不同的窄带噪声产生的掩蔽阈值曲线的形状是不同的。 语音的感知(10) 为了描写窄带噪声对纯音调信号的掩蔽效应,引入临界带宽的概念。 一个纯音可以被以它为中心频率,且具有一定带宽的连续噪声所掩蔽,如在这一频带内噪声功率等于该纯音的功率,这时该纯音处于刚好能被听到的临界状态,称这一带宽为临界带宽。 连续的临界频带序号记为临界频带率,或称为Bark域。为了纪念Barkhauseu。 通常将20Hz到16kHz之间的频率用24个频率群来划分,或者说共有24Bark。 语音的感知(11) 语音的感知(12) 声压级相同,但临界频带率不同的掩蔽阈值曲线如下图。 语音学基础知识(1) 2.3 语音学基础知识 音素是语音的基本单位。可以分为元音和辅音。 元音是指发音的过程中,对声腔气流无明显阻塞而发出的音段,如[a]、[i]等。 辅音是声腔气流明显受阻时所发出的音段,如[m][n]等。 此外还用半元音、双元音、半辅音等等。 语音学基础知识(2) 对一组语言来讲,可以用一组音素来描述。 美国英语包括42个音素,分为:元音12个;双元音6个;半元音4个;辅音20个。 汉语普通话是以北京语音为标准音,以北方话为基准,国际上常用的词为(mandarin)。 汉语采用声韵结构,每个字音分成两部分,前面的部分称为声母(initial),后一部分称为韵母。 声母为辅音,但不是所有的辅音都可以做声母。声母共22个。 语音学基础知识(3) 声母表 b p m f d t n l g k h j q x zh ch sh r z c s 韵母可以包括一个元音,也可以包括多个元音,也可以包括辅音。韵母共38个。 韵母表 I u ü A ia ua o uo e ie üe ai uai ei uei ao iao ou iou an ian uan üan en in uen ün ang iang uang eng ing ueng ong iong 语音学基础知识(4) 汉语音素为64个,分为辅音、单元音、复元音和复鼻尾音。 汉语的每个字就是一个音节。音节由声母和韵母拼接而成,音节中也可以不包含声母。 无调音节415个。 无调音节列表 每个音节可以有四种声调,因此有调音节一千二百多个。 语音学基础知识(5) 汉语音节的声调主要体现在信号的基音频率随时间而变的规律上。 Ⅲ 时域、频域处理方法 Ⅲ 时域、频域处理方法(1) 主要内容 3.1 时域处理方法 3.2 端点检测 3.3 频域处理方法 3.4 时频分析技术 3.5 同态解卷积 3.6 Mel倒谱系数 Ⅲ 时域、频域处理方法(2) 3.1 时域处理方法 3.1.1 语音信号的采样和量化
您可能关注的文档
最近下载
- 呼吸衰竭ppt(共40张PPT).pptx VIP
- 7.1《风景谈》课件(共41张PPT)(含音频+视频).pptx VIP
- QXT3传感器中文操作手册.pdf VIP
- 病理科医疗质量自查表.docx VIP
- 菲亚特博悦说明书.docx VIP
- 2014-6-30电力变电站钢结构装配式建筑、围墙、防火墙.pdf VIP
- 上海市市东实验学校2022-2023学年高一10月月考语文试题.pdf VIP
- 《半导体物理与器件》教学大纲.docx VIP
- 2025青海公司所属华电(格尔木)能源有限公司面向华电系统内外招聘180人笔试备考试题及答案解析.docx VIP
- 人教版道德与法治四年级上册教案.docx VIP
文档评论(0)