小布虚拟人的多场景应用实践.docxVIP

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

小布虚拟人的多场景应用实践

OPPO小布助手首席架构师

万玉龙

小布助手

2

2

国内首个月活破亿的手机语音助手

2.5亿

覆盖设备数

1.3亿

月活跃用户数

20亿

月均交互次数

OPPO、OnePlus、Realme智能手机和IoT设备的内置AI助手包含语音、建议、指令、识屏和扫一扫5大能力模块

“机智”、“有趣”、“温暖”多设备、跨平台、多场景

3

3

不断成长中的小布

首次发布跨界合作更名小布助手月活破亿营销/媒介创新安全性/可靠性/隐私性多模态交互3周年IP升级

2018.122020.052020.122021.022021.062021.092021.12

4

4

虚拟数字人

5

5

线上用户需求分析

高级

基础

高级需求情感诉求

进阶需求智能、懂我

基础需求

方便、高效、解放双手

朋友

助手

工具

?形象拟人化,声音、动作、表情丰富自然

?对话交流直击用户内心,满足情感需求

?单指令执行APP二级指令复杂任务

?结合对情景智能和用户理解主动建议

?查天气,系统设置,播音乐等

?更多提高操作效率的功能

6

6

虚拟助手行业趋势

7

7

虚拟助手行业趋势

☆☆

8

8

智能交互技术发展

语音交互语音识别语音合成

语音交互

语音识别

语音合成

自然语言理解

知识图谱

?以语音形式与用户交互

?释放双手,一语即达

?通过VUI给予用户反馈

触屏交互

触屏

自然语言理解

知识图谱

?以触屏方式与用户交互

?依赖用户手部接触

?通过GUI给予用户反馈

文字交互

自然语言理解

知识图谱

?以文本形式与用户交互

?依赖用户双手输入文本

?以文本展示给予用户反馈

多模态交互

计算机视觉多模态驱动

语音识别

语音合成

自然语言理解

知识图谱

?以虚拟人形态与用户交互

?释放双手,一语即达

?通过语音、表情、手势、动作等给予用户反馈

9

9

虚拟数字人

虚拟非物理世界?设备:显示屏(2D/XR),

虚拟

非物理世界

?场景:虚拟助手,虚拟主播,数字员工

数字技术驱动?建模:数字建模(CG)

数字

技术驱动

?建模:数字建模(CG)

?驱动:动捕驱动,AI驱动

?形象:卡通-写实-超写实

?行为:动作、表情、声音等

?智能:能感知,可交互

10

外观/行为/智能

小布虚拟人

11

11

首个基于虚拟人多模态交互的手机智能助手

12

12

两套技术方案

真人驱动算法驱动

真人驱动

算法驱动

AI捕捉设备捕捉真人数据采集

AI捕捉

设备捕捉

真人数据采集

形象设计

形象设计

驱动参数训练

驱动参数训练

动作捕捉参数3D建模

动作捕捉参数

3D建模

语音合成驱动参数预测关键点绑定

语音合成

驱动参数预测

关键点绑定

录音采集

录音采集

驱动渲染

驱动渲染

虚拟人影像!

虚拟人影像

变声器

变声器

!

!

l

l虚拟人

13

13

主体制作

形象设计3D建模关键点绑定

14

14

真人驱动

惯性动捕动捕

惯性动捕

动捕软件

渲染引擎

渲染引擎

光学动捕

光学动捕

15

15

算法驱动

文本特征

WordEmbedding

WordEmbedding

“大家好,我是布美美”

语音

语音合成

动作预测模型

动作系数

渲染

渲染引擎

话术文本音频波形音频特征元辅音识别模型元/辅音Blendshape虚拟人驱动

16

16

知识图谱对话式虚拟人架构

知识图谱

语音唤醒

自然语言生成

自然语言生成

人声检测对话平台语音识别语义理解

人声检测

对话平台

语音识别

您可能关注的文档

文档评论(0)

医疗行业资料分享 + 关注
实名认证
文档贡献者

医疗行业资料分享

1亿VIP精品文档

相关文档