- 1、本文档共24页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
西南林学院
西 南 林 学 院
本 科 毕 业(设计)论 文
(二○○四 届)
题 目: 基于DTW模型的语音识别
分院系部: 计算机与信息科学系
专 业: 计算机科学与技术
姓 名:
导师姓名:
导师职称:
二○○四年六月一日
基于DTW模型的语音识别
彭丹
摘要:语音别(Speech Recognition)是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。在课题中,通过采用DTWynamic time warping, 动态时间伸缩算法,对实现孤立词的识别进行了初步探讨和研究,并针对DTW的主要特点及不足做出了总结。基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题语音识别 DTW 动态规划Voice-Identification Based on DTW Model
Dan Peng
(Dept. of Computer and Information Science, Southwest Forestry College, Kunming, Yunan, 650224, China)
Abstract: Voice-identification is a kind of technology that is using computer to transfer the voice signal to an associated text or command by identification and understand. In this paper, DTW arithmetic is adapted to study and research the implement the identification of single-word, and Speech recognition for single-word is realized by using MATLAB. In the end, this paper gets a conclusion on the feature and the shortage of DTW.
DTW arithmetic based on the method of DP has solved the problem that the voice has different time during the template matching. This paper also put forward some advises about DP.
Key words: Voice-Identification DTW MATLAB DP
目 录引言 1
1 开发背景及可行性分析 1
1.1 开发背景 1
1.2 可行性分析 2
2 语音识别基础 2
2.1 语音识别概述 2
2.2 语音识别系统分类 3
2.3 语音识别技术介绍 3
2.3.1 语音识别单元的选取 3
2.3.2 特征参数提取技术 4
2.3.3 模式匹配及模型训练技术 4
2.4 语音识别系统的基本构成 5
3 Matlab 简介 6
4 算法阐述 7
4.1 DTW算法原理 7
4.2 DTW算法实现 9
4.2.1 算法简介 9
4.2.2 程序运行流程 9
4.3 运行结果 10
4.4 算法改进 11
5 总结 12
5.1 语音识别难点 12
5.1.1 语音识别系统的开发过程中的难点 12
5.1.2 语音识别系统的实际应用中的难点 13
5.1.3 语音识别所面临的实际情况 13
5.2 课题总结 14
5.3 课题心得及长远发展 14
参考文献 15
致谢 16
附录 源程序代码 17
引言
语言是人类特有的功能,声音是人类最常用的工具。通过语音传递信息是人类最重要、最有效、最常用和最方便的信息交换形式[12]。语言信号是人类思想疏通和情感交流的最主要途径。让计算机能听懂人类的语言,是自计算机诞生以来梦寐以求的想法。在课题中,将针对DTW算法,讨论如何实现个别个体的特定声音语音识别。
1 开发背景及可行性分析
1.1 开发背景
项目来源于云南省重点项目西双板纳自然保护区系统建设。综合应用传感器技术,数字仿真技术,数据编码与数据压缩技术,DSP技术,无线传输技术等,研究自然保护区视频信号、声音信号以及其他监测信号的采集、传送、处理方案,设备选型方案,二次开发技术,为自然保护区信息系统建设。
研究内
您可能关注的文档
- 物质构成的奥秘.doc
- 物质构成的奥秘的综合复习一、物质的组成和分类.ppt
- 物资采购、入库工作流程图.doc
- 物质世界和实践联系与发展客观规律性与主观能动性.ppt
- 物资银行的服务理念与解决方案.ppt
- 误差定义、来源、分类、测量精度.ppt
- 西安电子科技大学.doc
- 误差理论与数据处理.ppt
- 西安电子科技大学教学成果奖申报书.doc
- 西安工程大学2017年人才招聘公告.doc
- 仓库日常作业管理流程.pptx
- 地理图表解析攻略:2025年初中学业水平考试地理模拟试题集.docx
- 2025年热处理工(操作工)职业发展策略实施案例分析考试试卷.docx
- 2025年审计师考试审计审计方法案例分析试卷.docx
- 2025年数字视频合成师考试数字视频剪辑与特效制作实战试题.docx
- 多色化学发光水凝胶:从原理、制备到应用的全面探索.docx
- 2025年统计学期末考试题库:统计学术论文写作与数据分析技巧试题.docx
- 2025年成人高考语文高频考点速记题库:作文构思与提升技巧实战演练试题.docx
- 2025年小学英语毕业考试模拟试卷:绘本阅读理解与写作技巧.docx
- 尿抗原测定:成人社区获得性肺炎快速诊断的关键路径与临床价值.docx
文档评论(0)