最高语音品质数字信号处理ic的研发之路.docVIP

最高语音品质数字信号处理ic的研发之路.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最高语音品质数字信号处理ic的研发之路

最高语音品质数字信号处理IC的研发之路 数字信号处理ICBU8332KV-M,系知名半导体制造商罗姆(ROHM)面向智能手机和汽车导航仪等设备上所使用的麦克风, 开发出使两个无指向性的麦克风形成敏锐的指向性(波束赋形技术)、提高语音品质的高端IC产品,品质极高。 本产品采用波束赋形技术形成指向性,因为将指向轴转向声源的方向,所以大大降低了环境噪音。通过噪音抑制的功能,进一步降低残留在指向轴方向的固定噪音。这个技术和仅仅使用噪音消除的技术不同,可以更加强调声源。而且,由于能够在仅仅10mm的窄间距上安装两个麦克风,所以能够内置于以智能手机为代表的各种小型设备上。通过最优化处理,波束赋形技术可以将使用时的处理延迟时间控制在10msec以下,使得对于其它应用程序的影响控制在最小的限度内。通过这些措施,有助于提高各种设备的语音识别率和改善免提的通话质量。 前期工序的生产基地在罗姆株式会社(日本京都市),后期工序在ROHM Electronics Philippines, Inc.(菲律宾)进行,从2012年8月份开始以月产8万个的规模投入量产。 近年来,随着语音识别技术的日益发展,语音输入系统广泛应用于以汽车导航仪及智能手机为首的移动设备上,今后,也将要扩展到家电产品。另外,在全球化商业模式之下,视频通话以及电视会议的日益频繁,未来开发性能更加良好的拾音技术势在必行。 在这种趋势下的拾音技术,需要使声源变得更加清晰。迄今为止,指向性麦克风只能通过物理结构(筒状结构)形成指向性,但是,要想使指向性提高,就会出现麦克风的尺寸变大,而物理结构没有变化,不能够控制指向性等问题出现。 此次,罗姆开发出的这款数字信号处理IC,通过采用使用两个无指向性的麦克风的波束赋形技术,使特定方向的声源语音变得清晰。 使用两个麦克风形成指向性的技术早已被应用,但现有技术为了提高指向性,必须拉长麦克风间距,所以不能适应小型便携式设备的搭载要求。另外,数字信号处理的延迟时间及音质劣化,也是今后继续要攻克的研究课题。 而如今,罗姆采用DiMAGIC Corporation的指向性控制技术,并且成功地使环境噪音大幅度地衰减。利用波束赋形技术形成指向性,并且通过把指向轴转向声源方向,从而衰减了声源以外的语音。在指向轴方向残留的固定噪音通过噪音抑制的功能得以降低,因而使得声源变得清晰。其结果是使得背面方向的衰减量较传统的麦克风改善30dB以上。因为能在仅仅10mm的麦克风间距实现这样的效果,所以可以搭载在小型便携设备上。另外,通过最优化处理,波束赋形技术可以将使用时的处理延迟时间控制在10msec以下,使得对于其它应用程序的影响控制在最小的限度内。再者,由于能够转换指向性的形态和锐度,所以可以根据用途而实现最佳的指向性。 <特点> 1.敏锐指向性可以更加清晰地拾取声源 独有的信号处理技术,与以往麦克风比较,实现了敏锐的指向性,进行声音的清晰度处理。声源方向(0o)对于背面方向(180o)的衰减量与以往的麦克风比较大幅度改善30dB以上。此外,还可以实现10mm安装间距。 <BU8332KV-M与以往麦克风指向性特点的比较> *上图为从视觉上表示指向性的图表(指向性)。 圆表示从中心的方向开始,红线表示各个方向的放大。并且,将0o方向取为声源的方向。 2.大幅度提高语音识别率 可以使语音不劣化,能降低环境噪音。因此,提高在环境噪音条件下的语音识别率。通过本公司的检测,在环境噪音等级55dBSPL的环境下的语音识别精度从5%提高到90%。 <使用BU8332KV-M时的语音识别精度> 未使用时,噪音等级为55dBSPL,识别率急剧下降, 使用时,则即使噪音等级为65dBSPL,也可以实现45 %的识别率。 3.可以选择指向性模式 可以将指向性模式转换为四种形态,而且能将指向性的方向反转180o,也可以调整指向性锐度。这些控制可以不改变麦克风的配置,而只是进行寄存器的设定。 ① 无指向性:全方位的拾音。 ② 单一指向性: 拾取正前方的语音,并且衰减后方的语音。 ③ 锐心型指向性: 比起单一的指向性来,还衰减侧方的语音。 ④ 双指向性: 比锐心型指向性更加衰减侧方的语音。 4.其它的功能 ?使用波束赋形技术功能时的处理延迟时间为10msec以下。 ?搭载降低残留在轴向指向方向的固定噪音的噪音抑制功能。 ?采样频率16kHz。 ?模拟输出(LINEOUT)或者数字输出(PCM接口)。 ?可用3.3V的单系统工作(内置核心电源调节器)。 ?内置有麦克风用偏压、前置放大器的电路。 ?双线主机接口。 ?可以单机工作(内置EEPROM用SPI接口)。 <用语说明> ?波束赋形技术 是利用多个麦克风的相位差,降低目标方向以外的语音的技术。降低环境噪音,提高目标声源的清

您可能关注的文档

文档评论(0)

牛X文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档