基于fpga的说话人识别系统设计.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于fpga的说话人识别系统设计

基于FPGA 的说话人识别系统设计 陈勇,李晶皎,石鑫,张莉佳 摘要:说话人识别作为一种生物识别技术,能够根据测试语音来辨别说话者的身份。本 文针对实时性问题提出了一种以FPGA(Field Programmable Gate Array)为硬件平台的解决方 案。该方案以MFCC 为语音特征,采用了基于矢量量化的说话人识别算法。系统主要包括语 音信号采集、端点检测、特征提取和识别判断4 个部分。 经测试证明,该系统完成了文本相关的说话人识别系统的基本功能。在实验室条件下, 当系统时钟为50MHz 时,完成一次4 码本系统的识别耗时15.932ms;12 码本系统的识别率 为93.3% 。 关键词:说话人识别;端点检测;MFCC;矢量量化;FPGA Design of Speaker Recognition System Based on FPGA Abstract :As a biometric identification technology, speaker recognition can verify the identity according to the test voices. For real-time problem, this paper presents a solution that makes the FPGA as the hardware platform. The system consists of four parts: Signal Acquisition, Endpoint Detection, Feature Extraction and Identification. The experiment results show that the time-consuming is 15.932ms on the 4 codebooks and 50MHz-clock system, the identification rate is 93.3% on the 12 codebooks system. This kind of design improves the system’s recognition speed, which is an effective program to solve the real-time problem. Keywords: Speaker Recognition; VAD; MFCC; Vector Quantization; FPGA 1. 说话人识别理论基础 说话人识别的过程可以分为:语音信号预处理、特征提取和识别判断三个部分。其 中,识别判断由码本训练和识别两部分组成,原理如图1.1 所示。 训练 码本 语音信号 预处理 特征提取 计算失 识别判决 识别 真测度 图1.1 说话人识别原理图 语音信号的预处理包括采样和量化、预加重、分帧、加窗、端点检测等。预处理的目的 是去除噪声,加强有用的信息,并对输入应测量仪器或其他因素造成的退化现象进行复原。 特征提取是系统关键部分。近年来,一种能够比较充分利用人耳非线性系统感知特性的 参数得到了广泛的应用,这就是Mel 频率倒谱系数[1] 。临界频率带宽随着频率的变化而变化, 并与Mel 频率增长一致[2] 。在1000Hz 以下,大致呈线性分布,带宽为100Hz 左右;在1000Hz 以上呈对数增长,具体如式(1.1)所示。 Mel

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档