- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最佳路径问题(如何求:Q=q1q2…qT) 前向-后向算法的缺点 计算量的浪费 状态路径不能明确判定 Viterbi算法 不完全的状态空间有哪些信誉好的足球投注网站 保留状态转移路径的信息 * 最佳路径问题(如何求:Q=q1q2…qT) Viterbi算法的有哪些信誉好的足球投注网站空间 * Viterbi识别算法和路径回溯 * 模型训练问题(如何求:A、B、π) 优化问题 优化目标:P(O|λ)最大 Lagrange数乘法,辅助函数: * Baum-Welch参数重估算法: * 模型训练问题(如何求:A、B、π) 连续HMM算法 连续的含义 参数重估 识别算法 * “连续”的含义 连续混合高斯概率密度函数(pdf): 每个状态表示为若干函数fn(x)的线性组合 fn(x)是连续高斯概率密度函数 * 连续HMM参数重估(1) 需要重估的参数: 起始概率 转移概率 各状态中不同pdf的权 各状态中不同pdf的均值和方差 * 连续HMM参数重估(2) t时刻序列处于状态j、混合高斯密度l的概率 * 连续HMM参数重估(3) pdf的无溢出参数重估公式 * 识别算法 概率计算: P(O|λ) Viterbi算法 对数形式 与离散HMM相似,只需替换bjl(x) * 实际HMM系统的具体问题 起始概率的问题 转移概率的问题 模型的自适应 区别性训练 * 起始概率的问题 自左向右结构的HMM,起始概率为: [1, 0, 0, … 0] 即:只能从第一个状态开始 * 转移概率的问题 大量实验证明:转移概率对识别性能的影响是微不足道的 训练过程中,常常将其设定为常数: aij=0.5 识别过程中,不进行log(aij)的累加仅考虑bi(.)的作用 * 模型的自适应(1) 自适应的必要性 口音 感冒... MAP自适应算法 MAP: 最大后验概率准则 本质上是重新训练一次,对原B矩阵进行微调 特点:简单,对每个HMM单独自适应,只需一次发音 * 模型的自适应(2) MLLR算法 MLLR:最大似然线性回归 本质:将原模型的参数进行线性变换后再进行识别 特点:少量语音可以对所有模型进行自适应,只要得到线性变换矩阵即可 * 区别性训练 传统HMM训练算法的缺陷 MCE算法 MCE:最小分类误差准则 使用场合:小词表识别系统 需要细致调整算法参数,才能保证收敛 * 中文语音识别的特点 相对于西方语言来说,中文有自己的独特之处。中文是有调语言,发音的基本单元是声母和韵母并且以音节为自然单位,一个音节就是一个字甚至词,以至字词的时长很短,混淆度更大。 另外,中文用415个基本的无调音节来构成7000多个基本汉字的发音,多音字很多。 特别是,中文的发音和字是独立的,仅仅是中国大陆地区就有很多的方言,口音问题非常严重。特别是在做中文孤立词和短语命令识别的时候,由于没有上下文的信息并且语音的长度很短,口音会严重地降低识别率。 * 中文语音建模基元比较 * 语音识别应用举例 嵌入式语音识别: 智能玩具:语音对话娃娃、语音声控机器人 智能家电:语音识别台灯、语音识别插座 智能手机:语音拨号 电话语音识别: 语音电话簿:电信增值 智能语音总机:企业应用 * 嵌入式语音识别 * 智能玩具—语音对话娃娃 序号 问句 应答句 1 你好 3条 2 你叫什么名字? 3条 3 你从哪里来? 3条 4 你会什么? 1条 5 背首诗 15首诗 6 讲个故事 6个故事 7 我要听笑话 4个笑话 8 唱首歌 5首歌曲 9 来首英文歌 5首英文歌 10 你喜欢玩什么? 5条 11 你好可爱 3条 12 我很喜欢你 3条 智能玩具—语音声控机器人 问句 回答 前进 前进 后退 后退 左转 左转 右转 右转 跳舞 跳舞 语音增值业务 企业电话簿:会议通知、语音信箱、传真信箱、企业邮箱、信息发布、定向广告。 个人电话簿:个人邮件、数据同步、资讯定制、个人财经、业务定制。 语音门户:天气、股票、航班查询。 * 主要内容 声音处理技术 语音识别技术 声纹识别技术 技术演示 * 生物识别技术优势 生物识别技术比较 错误接受率 错误拒绝率 容易实用性 处理速度/人 指纹识别 很低 较低 好 2s-5s 掌纹识别 低 5% 使用困难 5s-10s 人脸识别 低 0.2% 非常好 ≤5s 虹膜识别 很低 约10% 需要培训才能使用,手工操作对虹膜有困难 仪器自动对准虹膜需要3s-5s,手工操作需要5s-25s 视网膜识别 未知 未知 不好 15s-30s 声纹识别 低 低 可以 1s-3s 签名识别 低 10% 一般 5s-10s 声纹识别技术 声纹识别(又称说话人识别)技术是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的生物识别技术。 语音声纹识别技术及应用 语音
您可能关注的文档
最近下载
- 显微镜的详细介绍及使用方法.ppt VIP
- 初中数学浙教版七年级上册 5.1认识方程课件(17张PPT).pptx VIP
- mipi_C-PHY协议参考手册_specification_v1-2.pdf
- 《光伏发电项目电气一次系统总体设计方案》.doc VIP
- 第9课《天上有颗“南仁东星”》教学设计统编版语文八年级上册.docx
- 综合布线技术知识项目教程(第3版)任务3认识布线管材和机柜.ppt VIP
- 银行网点可行性报告.docx VIP
- Unit7西方文化导论.ppt VIP
- 人教版初中七年级英语上册全册教案(全英文版).pdf VIP
- 2024小学六年级奥林匹克数学竞赛决赛试卷及答案.pdf VIP
有哪些信誉好的足球投注网站
文档评论(0)