- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《智能仪器》课程设计
题 目: MATLAB实现语音识别功能
班 级:
学 号:
姓 名:
同组人员:
任课教师:
完成时间: 2012/11/3
目录
设计任务及要求………………………………………………1
语音识别的简单介绍
2.1语者识别的概念……………………………………………2
2.2特征参数的提取……………………………………………3
2.3用矢量量化聚类法生成码本………………………………3
2.4VQ的说话人识别 …………………………………………4
算法程序分析
3.1函数关系………………………………………………….4
3.2代码说明……………………………………………………5
3.2.1函数mfcc………………………………………………5
3.2.2函数disteu……………………………………………5
3.2.3函数vqlbg…………………………………………….6
3.2.4函数test………………………………………………6
3.2.5函数testDB……………………………………………7
3.2.6 函数train……………………………………………8
3.2.7函数melfb………………………………………………8
演示分析…………………………………………………….9
心得体会…………………………………………………….11
附:GUI程序代码………………………………………………12
设计任务及要求
用MATLAB实现简单的语音识别功能;
具体设计要求如下:
用MATLAB实现简单的数字1~9的语音识别功能。
语音识别的简单介绍
基于VQ的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所提取的特征参数进行分类,产生不同码字所组成的码本。在识别(匹配)阶段,我们用VQ方法计算平均失真测度(本系统在计算距离d时,采用欧氏距离测度),从而判断说话人是谁。
语音识别系统结构框图如图1所示。
图1 语音识别系统结构框图
2.1语者识别的概念
语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这就使得通过分析语音信号来识别说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有的特征,不会丢失或遗忘;语音信号的采集方便,系统设备成本低;利用电话网络还可实现远程客户服务等。因此,近几年来,说话人识别越来越多的受到人们的重视。与其他生物识别技术如指纹识别、手形识别等相比较,说话人识别不仅使用方便,而且属于非接触性,容易被用户接受,并且在已有的各种生物特征识别技术中,是唯一可以用作远程验证的识别技术。因此,说话人识别的应用前景非常广泛:今天,说话人识别技术已经关系到多学科的研究领域,不同领域中的进步都对说话人识别的发展做出了贡献。说话人识别技术是集声学、语言学、计算机、信息处理和人工智能等诸多领域的一项综合技术,应用需求将十分广阔。在吃力语音信号的时候如何提取信号中关键的成分尤为重要。语音信号的特征参数的好坏直接导致了辨别的准确性。
2.2特征参数的提取
对于特征参数的选取,我们使用mfcc的方法来提取。MFCC参数是基于人的听觉特性利用人听觉的屏蔽效应,在Mel标度频率域提取出来的倒谱特征参数。
MFCC参数的提取过程如下:
1. 对输入的语音信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱分布信息。
设语音信号的DFT为:
(1)
其中式中x(n)为输入的语音信号,N表示傅立叶变换的点数。
2. 再求频谱幅度的平方,得到能量谱。
3. 将能量谱通过一组Mel尺度的三角形滤波器组。
我们定义一个有M个滤波器的滤波器组(滤波器的个数和临界带的个数相近),采用的滤波器为三角滤波器,中心频率为f(m),m=1,2,3,···,M
本系统取M=100。
4. 计算每个滤波器组输出的对数能量。
(2)
其中为三角滤波器的频率响应。
5. 经过离散弦变换(DCT)得到MFCC系数。
MFCC系数个数通常取20—30,常常不用0阶倒谱系数,因为它反映的是频谱能量,故在一般识别系统中,将称为能量系数,并不作为倒谱系数,本系统选取20阶倒谱系数。
2.3用矢量量化聚类法生成码本
我们将每个待识的说话
您可能关注的文档
- 普通网络营销策划书以公司为分析案例.doc
- 电大教务考历年考题二.doc
- 论我国行政许可制度存在问题完善对策终稿.doc
- 工信部企业司副司长许科敏一行赴陕调研企业服务平台建设运行情况.doc
- 工艺流程图绘制方法PID10915.doc
- 湖北农村学校艺术教育之现状分析对策研究——以随州为例.doc
- 阿嘎如创业大赛作品127.doc
- 太阳能路灯控制系统常用英语词汇表达解释精华归纳.doc
- 场营销学考试复习.doc
- 浅议我国上公司资本结构其优化对策.doc
- 《地域文化元素在城市公共艺术景观中的情感价值研究》教学研究课题报告.docx
- 2025年农产品质量安全追溯体系在冷链物流环节的应用与挑战报告.docx
- 基于编程教育的初中化学实验探究式教学实践研究教学研究课题报告.docx
- 航空发动机维修技术优化与成本控制方案实施报告.docx
- 高中数学教学中数学文化融入的实践与思考教学研究课题报告.docx
- 2025年共享农业体验园规划设计案例集锦报告.docx
- 2025年生物识别技术在网络安全隐私泄露风险防控研究报告.docx
- 线上绘画艺术培训平台在2025年艺术教育行业的市场机会与挑战分析报告.docx
- 生物科技前沿:2025年基因编辑技术在心血管疾病治疗中的应用探索.docx
- 2025年生物识别技术在金融领域隐私泄露风险防控研究报告.docx
最近下载
- 2012年单证员考试国际商务单证缮制与操作真题试题与答案 .pdf VIP
- 2016年国际商务单证员《国际商务单证缮制与操作》历年真题及详解.doc VIP
- 2023年单证员考试国际商务单证缮制与操作真题试题及答案.doc VIP
- 医院护理培训课件:《如何进行有效的护患沟通》.pptx
- 2024年单证员考试国际商务单证缮制与操作模拟真题试题与答案.doc VIP
- 广发证券-顺丰控股-002352-多年布局终结果,时效国际两开花.pdf VIP
- 2022年单证员考试操作试题及参考答案.doc VIP
- 女性乳腺癌术后患肢功能锻炼.ppt VIP
- 2024江苏省地质局所属事业单位招聘89人笔试模拟试题及答案解析.docx VIP
- 血液灌流课件.ppt VIP
文档评论(0)