- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
DSP课程设计实验报告_语音识别
目录一、设计任务书 1
二、设计内容 2
三、设计方案、算法原理说明 2
1 系统概述 2
2.硬件构成 3
2.1 系统构成 3
2.2 系统主要功能模块构成 3
3.语音识别算法软件实现 4
3.1 系统流程图 4
3.2 语音信号的端点检测 5
3.3 特征参数的提取 7
3.4 建立语音库 8
3.5 特定人语音识别算法 9
四、程序设计、调试与结果分析 12
五、设计(安装)与调试的体会 18
六、参考文献 19
附录 课程设计成绩评定 20
一、设计任务书
语音技术,包括语音识别、语音合成、关键词检出、说话人识别与确认、口语对话系统等,是现代人机交互的重要方式之一,具有广泛的应用前景。其中语音识别技术,尤其是连续语音识别技术,是最基础、最重要的部分,而且已经逐步走向成熟与实用。
语音识别是研究使机器能够准确地听出人的语音内容的问题,即准确地识别所说的话,语音识别是近二三十年来发展起来的新兴学科,在计算机、信息处理、通信与电子系统、自动控制等领域中,在工业、军事、交通、医学等方面有着广泛的应用。
语音识别装置有着重要的应用价值。而计算机技术=模式识别和信号处理技术及声学技术的发展也使满足各种需要的语音识别的实现成为可能。
语音识别按不同的角度有以下几种分类方法:
从所要识别的单位。有孤立词识别、音素识别、音节识别、孤立句识别、连续语音识别和理解。目前已进入识别的语音识别系统是单词识别。以几百个单词为限定识别对象。
从识别的词汇量来分。有小词汇(10-50个)、中词汇(50-200个)、大词汇(200以上)等。
从讲话人的范围来分。有单个特定讲话人、多讲话人和与讲话者无关。特定讲话人比较简单,能够得到较高的识别率。后两者难度较大,不容易得到高的识别率。
从识别的方法分。有模块匹配法、随机模型法和概率语法分析法。这三种都属于统计模式识别方法。
这三种方法都建立在最大似然决策bayes判决的基础上,但具体做法不同,简述如下:
模块匹配法。
随机模型法。
概率语法分析法。
除了上面三种方法,其他的识别方法包括人工神经网络语音语音识别、应用模型数学识别的语音识别语句等。
对于汉字语音的识别,本质上和其他语音识别没有区别,也有其特点。主要是它宜于用音节作为基本研究对象,从而使特征的提取、字节的分割、动态时间匹配的选取等也具有特点。目前汉语识别的研究重点主要是以词为单位的孤立词识别和连续语音识别对等。
本实验的主要任务就是对以TMS320VC5402芯片为核心的系统硬件设计进行了研究,通过TLC320AD50C对语音信号进行A/D转换,通过TMS30VC5402对语音信号进行训练和识别,并由LED0、LED1、LED2亮来显示结果;该系统核心识别算法采用动态时间规整(DTW)算法,主要流程包括预处理、端点检测、提取特征值、模式匹配和模板训练,取得了很好的识别效果。
(1)对DMA进行初始化;
(2)对A/D、D/A进行初始化;
(3)编写DMA中断服务程序,实现语音信号的实时识别;
(4)根据识别系统的类型选择一种识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,作为标准模式由机器存储起来,形成标准模式库。
(5)对语音进行特征参数的分析,语音信号经过相同的通道得到语音参数,生成测试模板;
(6)将测试模板与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果,从而实现语音的识别。
三、设计方案、算法原理说明
1 系统概述
??? 语音识别系统的典型实现方案如图1所示。输入的模拟语音信号首先要进行预处理,包括预滤波、采样和量化、加窗、断点检测、预加重等。语音信号经过预处理后,接下来重要的一环就是特征参数提取,其目的是从语音波形中提取出随时间变化的语音特征序列。然后建立声学模型,在识别的时候将输入的语音特征同声学模型进行比较,得到最佳的识别结果。
2硬件构成
21 系统构成
??? 这里采用DSP芯片为核心(图2),系统包括直接双访问快速SRAM、一路ADC/一路DAC及相应的模拟信号放大器和抗混叠滤波器。外部只需扩展FLASH存储器、电源模块等少量电路即可构成完整系统应用。
22 系统主要功能模块构成
??? 语音处理模块采用TI TMS320VC5402,其主要特点包括:采用改进的哈佛结构,一条程序总线(PB),三条数据总线(CB,DB,EB)和四条地址总线(PAB,CAB,DAB,EAB),带有专用硬件逻辑CPU(40位算术逻辑单元(ALU),包括1个40位桶形移位器和二个40位累加器;一个17×17乘法器和一个40位专用加法器,允许16位带或不带符号的乘法),片内存储器(八个辅助寄存器及一个软件栈),片内外专用的指令集,允许使用业界最先进的定点DSP C语言编译器。TMS320VC5402含4 KB的片
您可能关注的文档
- AG_400IC网警相机闯红灯抓拍系统技术设计方案.doc
- ARM4510异步LED显示屏专用控制器说明书.doc
- ARM创新实验设计报告_基于EasyARM2013和键盘显示板的秒表程序.doc
- ARM嵌入式系统课程设计_I2C总线接口设计.doc
- ARM嵌入式系统与应用实验报告.doc
- ASEAN论文_广西—东盟高等教育合作现状及对策研究.doc
- Aruba无线测试方案.doc
- APS精益生产解决方案.doc
- AS_1657_1992_固定平台、走道、楼梯与梯子的设计、施工与安装.doc
- AX负载均衡器简明运维操作手册.doc
- DSP课程设计报告_基于TMS320VC5402的DSP最小系统设计.doc
- DSP课程设计_基于TMS320C5410芯片的余弦信号发生器.doc
- DSP课程设计(论文)_FIR滤波器设计.doc
- DSP课程设计(论文)_基于DSP的BIOS语音通信功能的实现.doc
- DSP课程设计(论文)_基于FIR的语音信号滤波.doc
- DTSF2026DSSF026型三相电子式多费率电能表使用说明书.doc
- DZ81_ME电力网络仪表使用说明书.doc
- DTM102N说明书.doc
- EASY_LASER激光对中及几何测量系统使用说明书(D450简易型激光对中仪).doc
- DSP课程设计_基于DSP的GPGGA提取.doc
文档评论(0)