- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于VQ的孤立词识别 语音识别一般分两个步骤。 学习(训练):建立识别基本单元的声学模型、文法分析的语言模型,存放于语音参数库。 识别(测试):根据一定的准则和测度将待识别模型与系统模型进行比较,判决得出结果。 识别过程涉及的基本原理 失真测度:在识别中,对待识别语音特征参数与训练特征参数的失真度量。 主要识别框架:基于模式匹配的动态规整、VQ和基于统计模型的GMM、HMM 概述 语音识别原理和识别系统组成 基于模式匹配VQ的语音识别 VQ用于语音识别共有四个步骤:特征提取、模板训练、模板分类、判决。 1、预处理: 主要包括抗混叠滤波 预加重 端点检测等。 2、语音特征参数提取: 时域特征:短时平均能量、短时平均过零率、共振峰、基音周期等; 频域特征:线性预测系数(LPC)、LP倒谱系数(LPCC)、线谱对参数(LSP)、短时频谱、Mel频率倒谱系数(MFCC)等。 语音识别原理和识别系统组成 3、参考模板 根据每个孤立词的训练数据生成每个孤立词的VQ模型 4、判卷准则 根据欧式距离进行结果选择 语音识别原理和识别系统组成 基于VQ的MATLAB程序结构 训练过程 MFCC_Tiwuzaosheng.m:提取孤立词的MFCC,用于聚类 提取所有孤立词的训练样本MFCC,每个孤立词保存为一个cell,这样可以在矢量量化时得到每个孤立词的聚类中心。保存的变量为: MFCC.mat 在程序运行之前首先要对训练样本进行归类,就是每个孤立词一个文件夹,这样可以得到每个孤立词的MFCC系数。 基于VQ的MATLAB程序结构 基于VQ的MATLAB程序结构 MFCC_Tiwuzaosheng.m的结果是提取每个孤立词每个训练语音样本的MFCC系数,且保存为MFCC_trainlist.mat文件 MFCC参数的格式是:每个孤立词一个structure 每个structure一个cell,包含了60个样本的MFCC系数 kmeans_vq.m:根据提取的MFCC系数,通过K均值聚类方法,得到每个孤立词的VQ中心矢量,用于识别。每个孤立词聚类中心都保存在kmeans_cent.mat变量中。 每个孤立词的MFCC进行一次VQ聚类,得到矢量中心,这里我们设置聚类个数为20. 基于VQ的MATLAB程序结构 识别过程 总的识别运行程序为:recognize.m 基于VQ的MATLAB程序结构 Shibie.m recognize.m disteu.m 1.完成基于VQ的孤立词识别系统仿真 2.改变MFCC系数阶数、每个孤立词VQ聚类个数、每个孤立词训练样本数时,分析系统的识别率差异 3.将原有的孤立词进行改变,识别孤立词为0、1、2,…,9十个数字,或者其它的10个孤立词,自己录制训练样本,实现不同孤立词的识别系统,并分析系统性能。 任务要求
您可能关注的文档
最近下载
- 2025年中国气泡水行业深度调研与行业竞争对手分析报告.docx
- 高等教育学教学课件电子教案全套课件.pptx VIP
- 46桂阳县方元镇秀里村和荷叶镇山田村历史遗留砷渣污染场地风险管控项目附件文本.docx VIP
- 2024人教版PEP英语三年级上册全册教学设计教案含反思.pdf
- 课题材料目录.pdf
- 美好生活劳动创造-中职生劳动教育教程PPT完整全套教学课件.pptx VIP
- 第十四届全多媒体课件大赛获奖作品名单-初中组.doc VIP
- 湖北省武汉市2020年中考英语真题(含答案).docx VIP
- 2026届高考写作指导:先行者与后来者作文主体段讲解.pptx VIP
- 《GBT_20801.1-2020_压力管道规范_工业管道_第1部分_总则》.pdf VIP
文档评论(0)