- 1、本文档共51页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
day2.3语音信号处理基础
* * 窄带的语谱图具有较好的频域分辨率:以较窄的频率间隔观察频域上的正弦波成分; 宽带的语谱图具有较好的时域分辨率:以较窄的时间间隔观察时域上的波动; * * 宽带语谱图 窄带语谱图 * 语谱图中可以观察到什么? 能量分布 谱线结构 声门波和声道幅频特性/共振峰 作用:反映时变频谱特征 * * 复旦大学计算机科学技术学院 窄带语谱图 滑动窗长度至少为两个基音周期; 如果滑动窗傅里叶变换的主瓣在各次谐波上无交叠,且旁瓣可以忽略,则: S(?,?)?(1/P2)?|H0(?k)W(?-?k,?)|2 近似为: S(?,?)?(1/P2)? |H0(?k)|2| W(?-?k,?)|2 具有较好的频域分辨率,能区分各次谐波谱线; 具有较差的时域分辨率; * * 复旦大学计算机科学技术学院 宽带语谱图 滑动窗长度小于一个基音周期; 缩短窗长会展宽滑动窗傅里叶变换后的频谱:测不准原理: 信号不能同时在时间和频率上任意窄; 当时间序列的宽度变小时,傅里叶变换会展宽; -》宽的信号产生窄的傅里叶变换;窄的信号产生宽的傅里叶变换; 较宽的滑动窗会发生交叠;从而淹没了谐波谱线结构; 窗长小,能较好的体现时域特征; 频域特征就比较差; * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 元音 语谱图中的共振峰 不同说话人发同一个元音的第一和第二共振峰形成一个聚类 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 鼻音 准周期激励 鼻腔:低频谐振 第一共振峰250Hz,之后几乎无能量 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 摩擦音 声源:噪声声源 清摩擦音 浊摩擦音: 清摩擦音+声带振动 * * 复旦大学计算机科学技术学院 浊摩擦音 浊摩擦音: x[n]=xg[n]+xq[n] 周期成份: xg[n]=h[n]*(g[n]*p[n])=h[n]*u[n] 噪音成份: xq[n]=hf[n]*(q[n]u[n]) q[n]看作噪声源,用u[n]调制后经过不同的声道响应hf[n]后,形成xq[n] * * 复旦大学计算机科学技术学院 爆破音——冲击 清爆破音 浊爆破音 浊爆破音与随后元音之间的时延更短 音栅(voice bar):口腔封闭时的声带低频振动声 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 VOT:时间延迟量 * * 复旦大学计算机科学技术学院 过渡语音——双元音 时变声道,在两个元音间平滑过渡 * * 复旦大学计算机科学技术学院 * * 复旦大学计算机科学技术学院 半元音 * * 复旦大学计算机科学技术学院 塞擦音:快速从爆破音移向摩擦音 协同发音 * * 复旦大学计算机科学技术学院 可区分的语音不仅取决于声源,还与不同的声道形态以及他们如何与周期性、噪声和冲击性声源相互作用相关; 描述这些语音类型的单位称为音素; * * 喉:由软骨、肌肉和韧带构成的复杂系统; 声带:两片带有肌肉及韧带的组织; * * 研究者根据这个过程的复杂过程,提出一种非线性的双质体模型以及更加精细的非线性多组件模型 * 声门闭相(closed phase):声带闭合并且没有气流通过的时间段; 声门开启相(open phase):刚开始有气流到气流速率达到最大值的时间段; 合拢相(return phase):气流速率从最大值回到声门关闭时零值的时间段; 声门气流速率:声门波; 基因周期(ptich period):声门波往复一次的时长; * 主瓣宽度与旁瓣衰落 * 送气音 浊音 送气式浊音 * * 浊音:周期性声门波激励产生的语音; 清音:其他形式声源产生的语音; * 复旦1号机器人研制组 复旦大学互动媒体研究所(IMI) 语音的产生和分类 肺:动力源头,气流送到喉 喉:将气流调制为周期或随机激励,送入声道 声道:口、鼻、咽腔,对声频谱整形 唇:形成可传播声波 * * 复旦大学计算机科学技术学院 语音的产生和分类 * * 复旦大学计算机科学技术学院 声源 产生语音的三种声源: 噪音 周期性 冲击 Shop的发音:Sh-o-p 音素(phoneme):构成语言的基本单元 * * 复旦大学计算机科学技术学院 发声机制 * * 复旦大学计算机科学技术学院 语音为什么是可辨别的,哪些因素决定? 声源:激励 声道形态:系统 语音:激励系统,产生输出 * * 复旦大学计算机科学技术学院 发音的生理解释 肺:吸入和呼出空气 发声机制:短促的吸入空气,平稳呼出; 喉: 作用:
您可能关注的文档
最近下载
- 跨部门沟通与协作(讲解版)课件.pptx VIP
- 2025甘肃白银靖远县人民法院招聘司法辅助人员6人笔试模拟试题及答案解析.docx VIP
- 骨科创伤的急救与处理.pptx VIP
- GB 8903-2024电梯用钢丝绳.pdf VIP
- JDCC 003—2024 公路波形梁钢护栏产品质量监督抽查实施规范.doc VIP
- 冷链物流管理全套教学课件.pptx
- JT∕T 1101-2016 职业潜水员心理健康评价.pdf
- 绿茶系统 Ghos XPSP3 WindowsXP系统绿茶系统 Ghos XP SP3 WindowsXP系统.doc VIP
- SL_T 276-2022 水文基础设施建设及技术装备标准(OCR).pdf VIP
- 冷藏集装箱 冷王 MAGNUM 操作手册中文.pdf VIP
文档评论(0)