- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
感知型智能机器时代已来临 底层声学是人工智能大爆发的基础?.doc
感知型智能机器时代已来临 底层声学是人工智能大爆发的基础? 项目小档案 项目名称:声智科技 行业关键词:科技、硬件、智能、声学 融资情况: 投资机构:洪泰、瑞峰 金额:1600万 轮数:Pre-A轮融资 项目概况:声智科技是一家人工智能交互与声学解决方案服务商,从事语音交互芯片、模组和设备研发、设计、制造并提供整体声学技术解决方案。现已完成Pre-A轮融资,其中由洪泰基金领投,峰瑞资本跟投。 从 iPhone 的 Siri、AlphaGo开始,近几年兴起的智能手环、智能医疗、无人驾驶等,都表示未来智能产业将成为新一代技术革命的急先锋。 机器已然从单纯的存储信息、处理海量数据,到可以“看懂”人类的文字,“听懂”人类的语言的阶段,未来还将创造更多不可能的奇迹。 那么,目前人工智能领域的投资又展现出怎样一派景象呢?其中又有哪些潜在的创业机会等待去挖掘? 一、广阔的市场蓝海等待开拓 1.人工智能市场蓝海待开拓 当前,人工智能已经开始渗透到各行各业,甚至走进寻常老百姓家。 据估算,2015年全球人工智能市场规模约484亿人民币,其中中国市场规模约12亿元人民币,其中60%的贡献来自语音识别,视觉识别占比达 12.5%。未来这一新兴行业将保持高速增长,根据BBC research的预测,2020年全球人工智能市场规模将达183亿美元,约合1190亿元人民币,年均增长率达19.7%;预计中国市场增速将高达50%,届时将有约91亿人民币的市场蓝海等待开拓。 随着多个发展瓶颈的接连突破,当前人工智能已经到了感知智能的阶段,同时新科技的热潮也依然没有停止翻涌。 不过,根据Gartner 2016年发布的新兴技术成熟度曲线图来看,人工智能应用普及还需时日,虽然感知型智能机器时代已经悄然来临。 目前领域重点主要聚焦在透明沉浸式体验(transparently immersive experience)、感知型智能机器时代(perceptual smart machine age)以及平台革命(platform revolution)。 这就代表,虽然目前基础条件储备基本完成,但人工智能应用化技术还比较生涩,更全面的数据还需完善,处于一个待成熟的时段。 在未来的5-10年,感知智能将逐步普及,但认知智能的突破尚不明朗。 3.深挖人工智能细分领域 据悉,2015年全球人工智能领域企业已获得将近12亿美元的投资。 而在国内,到 2016年初,中国人工智能领域的企业已达百家,其中约65家获得投资,共计 29.1亿人民币。 而本篇文章要介绍的就是一家专做智能硬件的公司,声智科技,属于感知型智能机器时代里的机器学习这一块。 二、声智科技,亮点何在 在智能家居领域,如今Amazon 智能音箱Echo出货量超过900万台,谷歌、苹果、微软也纷纷投入市场割据洪流中,而国内还没有成熟的智能音箱技术方案商。声智科技学习MTK等硬科技公司,提供一揽子式的智能音箱开发套件解决方案,并且秉承合共赢的理念,以开放和合作的态度,寻求智能音响全球领域的合作伙伴,共同搭建以用户为中心、数据为驱动、平台为服务,完整的人工智能交互图谱与闭环生态链条。 1.术业有专攻 智能语音交互的第一步是语音识别,但是一直以来,真实环境下远场语音识别的准确率都不好,很多AI公司都在试图通过深度学习的方法解决这个难题。 然而声智科技不这么认为。 声智科技的团队在中科院做了多年声学研究,很清楚物理底层信号的原理与难点,特别是人机交互所使用的语音信号。一般来说,人听到的声音包括直达声和反射声(人听自己说话的声音还包括骨导传输),当距离声源较远以后,声波的反射效果增强形成较强的混响,特别是在一些声学效果较差的环境,如果附近还有其他的噪声干扰,例如电视、风扇、汽车等等,即便我们人类也很难听清远处的人声,这就直接影响了远场语音识别的准确率(也会产生远程语音唤醒等难题)。 因而声智科技得出了以下的结论——虽然深度学习给语音识别带来了极大的提升,但在真实场景下,语音往往受到噪声、混响、回声等声学因素的干扰,致使输入云端模型的数据丢失大量特征,真实效果远未达到期望,因此最好从底层的声学技术切入去解决这个难题。 2.路径更快更可行 结论是下了,那么可行性呢? 要知道,想是一件事,做是一件事。 陈先生认为:深度学习识别的准确性主要依赖于模型的优化和数据的规模,同时也对训练样本数据的精度和维度都有极高要求,而这主要依赖于训练数据的采集和标注,但是目前来说,这些数据的获取几乎都是依赖于人力来完成。显然,这无法满足未来人工智能爆发式增长的需求,从底层声学技术入手,很可能是一条更容易实现的道路。 3.初有成效 该团队研发的回声抵消、噪声抑制、声源定位、混响消除、声音定向等核心技术和麦克风阵列等硬件已经量产应用,这也意味着解决真实场景下
文档评论(0)