基于ARM语音识别系统设计.docVIP

下载本文档

6
0
约3.47千字
约 8页
2018-06-17 发布于福建
举报
版权申诉

基于ARM语音识别系统设计.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于ARM语音识别系统设计

基于ARM语音识别系统设计　　　　摘要：本文基于当前嵌入式设备广泛应用的环境下，在语音识别技术的基础之上，设计了以ARM处理器为核心，Linux为操作系统的嵌入式语音识别设备。语音识别采用了流行的DHMM模型，并使用系统开销较小的Viterbi算法实现。总体来说，本文所设计的语音识别设备具有价格低、性能强、通用性好以及扩展能力强等优点。　　关键词：语音识别；DHMM；Viterbi；嵌入式系统；ARM 　　中图分类号：TP399 文献标识码：A文章编号：1006-4311（2012）04-0126-020引言　　随着计算机技术的飞速发展，各种各样的应用层出不穷，其中使用语音与计算机程序进行交互成为了最近热门的研究方向。语音作为人类与计算机之间无形的连接方式，可以使人们方便、快捷地控制和使用计算机。语音识别技术是能够让原来非智能的计算设备理解人类思想的高科技技术，融合了信号处理、人工智能以及自动化等多学科、多领域的研究成果，是目前实现人工智慧的主要途径之一。　　根据不同的分类标准，语音识别可分为不同的种类，例如依据识别对象的不同，可分为特定人语音识别及非特定人语音识别；又根据人类的讲话方式可分为孤立词识别、连接词识别以及连续语音识别。不同的识别系统虽然在语音识别过程中步骤相似，但根据不同系统的需求及特点其实现方式及具体细节是不同的[1]。　　嵌入式技术的迅猛进步，使得语音识别技术的应用更加广泛，不再局限于实验室以及大型场合；其已经被嵌入各种移动设备，为人们对移动设备的操作方式提供了一种崭新途径和使用体验。本文就针对移动设备的特点，设计了一种面向非特定人的孤立词语音识别系统。　　1语音识别的工作原理　　原始的自然语音信号中不仅含有人体自身的声音信号，同样也包含了大量的杂音、噪声等混杂在一起的随机干扰信号，尤其作为移动、嵌入式设备被使用者随身携带使用，会有更多的环境噪声信号。针对大量噪声的数据计算以及嵌入式设备有限的计算资源，为保证系统的对自然语言的正确识别率，并且有效减少处理原始语音信号的大量数据密集计算，有必要研究语音信号的预处理技术，以期高效提取语音特???参数，并选取合适的压缩算法进行语音数据压缩，之后再进行语音的模式匹配[2]。　　如图1所示，人本身的语音信号从语音录入设备进入后，将进行预处理、端点检测、特征提取，转换为可以对比的信号参数，然后将特征参数通过选取的特征匹配方法与参考样例库中的模板样例进行语言匹配，选择符合度最大的语言样例进行相应处理，得出识别结果。　　2系统硬件设计　　系统的硬件结构示意图如图2所示。　　系统的处理核心采用了韩国三星公司的一款基于ARM 920T内核的S3C2440微处理器；此款处理器中的CMOS宏单元和存储单元采用了0.18um电子工艺，内部总线采用Advanced Microcontroller Bus Architecture（AMBA）新型总线结构，具备出色的全静态设计，利用了多项低功耗技术，系统架构精简，特别为价格和功耗敏感的应用而精心打造。除此之外，它特别为各种外设准备了丰富的中断处理资源，包括总计共有60个中断源（其中包括5个定时器硬中断，9个串口中断，24个外部中断，1个看门狗定时器，4个DMA，2个ADC，1个LCD，1个电池故障，1个IIC，2个SPI，1个SDI，2个USB，1个NAND FLASH口，2个视频口和1个AC97音频口），这些中断既可以使用电平/边沿触发模式进行外部中断的触发，也可以使用软件编程的方式改变边沿/电平触发极性，能够为紧急中断请求提供快速中断（FIQ）服务[3]。　　系统工作时，人的语音信号经过MIC输入，并通过滤波、去噪等操作后，在S3C2440上执行语音特征提取、语音模式匹配算法，最终输出结果；系统中的USB接口可以方便系统外扩各种标准USB外设，以便使用语音识别结果进行各种设备控制。　　3系统软件设计　　3.1 Linux内核移植移植Linux内核一般分为几个固定的步骤，目前较为流行快速开发方法通常先在内核的处理器架构目录下，选择与目标开发板硬件结构最接近的并且各种配置较为完善的开发板目录作为移植模板。接着针对本开发板与目标开发板的硬件具体差别，进行对应的修改或使用前人发布的移植补丁进行升级。针对本开发板，我们使用了稳定的Linux-2.6.15内核进行移植，考虑到本系统的具体硬件配置，最后选择了SMDK2440开发板模板作为移植的目标开发板模板。在编译和配置内核前，建议使用menuconfig或其它配置工具对内核进行适当的裁剪，还可以进一步编写配置脚本。嵌入式Linux内核的裁减类似于PC上Linux内核的裁减，主要的工作是根据硬件和系统需求增添需要支持的模块，并除去无