- 1、本文档共23页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
小米知识图谱探索与应用
小米知识图谱于2017年创立,已支持公司了每天亿级的访问,已赋能小爱
同学,小米有品、智能问答、用户画像、虚拟助手、智能客服等互联网产品。通
过引入知识图谱,这些产品在内容理解、用户理解、实体推荐等方面都有了显著
的效果提升。
1.小米知识图谱介绍
小米在商业模式上提出硬件+新零售+互联网铁人三项的商业模式。这种商
业模式下有像手机、小米音箱类的智能硬件;有米商城,有品电商这样的新零
售;还有像人工智能这样的互联网服务。三者相扶相持,相互促进,是一种闭环
的生态模式,在这种生态模式下,有很多潜在的应用场景,对人工智能,对内容
和知识有很多诉求。
小米人工智能部已经构建了完整的中台体系,囊括了视觉、NLP、知识图
谱、语音、深度学习等底层的基础能力,其中知识图谱就处于这一层。
中间层是问答服务、智能客服等应用能力层,上层是小爱同学、商城等互联
网业务和传统业务层,这些都是知识图谱的落地场景,其中小爱同学是小米公司
推出的虚拟人工的智能助理,小爱同学适用于手机、音响、电视、手表以及手环
等穿戴设备,通过搭载小爱同学的智能硬件,可以满足用户获取知识和信息的需
求。
2017年小米知识图谱有了一些开放知识的积累,2018年知识图谱团队成
立,2018年底,通用知识图谱的构建,百科类图谱构建完成,2019年中,业务
拓展,线上调用达到近亿次,2019年底,知识扩增,知识积累了超三百亿,
2020年行业探索,行业图谱落地。虽然发展的比较晚,但是在自己的业务场景
下,发展还算迅速。
小米知识图谱在公司的职责,主要是研究开放领域和行业领域的构建和应用
技术,并把图谱推广到相关业务场景上,来提高用户的满意度的和业务变现转化
能力。团队已构建超三百亿开放知识和涉及13个领域。除此之外,小米还参与
了一些开放知识图谱的构建,是OpenKG之OpenBase子项目组主要成员单
位,是IEEE知识图谱国家标准编制组主要成员。
小米知识图谱已经已经赋能公司10+个业务场景,这些落地场景包括智能问
答、智能客服、小爱同学、虚拟助手、全局有哪些信誉好的足球投注网站、NLP等这样通用的知识领域。
还有像游戏中心、广告,小米有品,小米网等这样的行业知识。
2.应用场景
2.1智能问答
小米知识图谱在智能问答场景的应用落地的设备较多,已服务于手机、音
响、智能穿戴、智能车载、电视、儿童设备。应用于小爱音响、小爱同学、小寻
手表、车载设备等,满足用户近亿次/天的请求。
智能问答包括两种模式:一种是一般问答模式,还有一种是规则推理的。一
般问答场景下,在返回具体答案的同时,还会把关联实体的附加信息满足给用
户,比如用户询问巩俐的籍贯的时候,返回答案不只是会返回山东济南,还会把
问答实体巩俐的视频,人物关系,资讯新闻,代表作品等都呈现给用户,这样在
用户兴趣激发上起到了很大作用。另外一个古诗词CASE,也能很好的体现这一
点,比如用户问静夜思的作者是谁,用户除了想得到这首诗的作者外,可能还想
温故这首诗,也可能想要了解这首诗的释义。所以我们会把有声资源、释义一并
满足给用户。问答在歧义场景下还支持列表形式展现。
小米还支持推理的问答。比如:多条件推理,多跳关系推理,还支持像求最
大值,最小值这种基础推理算子。多条件推理的例子如:山东籍的双子座是谁,
首先会对数据库中人物实体的生日推理出星座是双子座,然后推出省份,最后筛
选聚合产出实体结果,第二种是多跳关系推理,比较典型的就是人物与人物的
六度关系推理,如:徐志摩与梁思成的儿子梁从诫是什么关系?我们会试图计算
起始实体到目标实体的关系的最短可达路径呈现给用户。现有的推理逻方法,比
如说基于规则的推理、基于模型的推理,规则推理主要包含规则引擎和一阶的逻
辑规则。模型推理是用机器学习去表示学习关系推理。所以这里根据自己的需
求、应用场景和应用情况去选择。
基于图谱的智能问答,通用流程如下:语音识别环节,意图识别,实体匹配,
实体查询返回结果。
举个例子,如武汉大学周边什么好吃的,首先做分词或者词法分析,分出武
汉大学和好吃的这些关键mention,然后意图识别计算得到是美食需求的,第三
步是实体识别,把mention武汉大学映射到知识图谱中的实体上,把属性好吃映
射成推荐食物,最后实体查询计算,返回热干面,武昌鱼,豆皮,油焖大虾。
您可能关注的文档
- 2024年徐州市铜山区事业单位考试《医学基础知识》试题 .pdf
- 2024年变配电工程承包合同范本(通用) .pdf
- 2023年道路运输企业安全生产管理人员参考题库含答案3 .pdf
- 2024学年八年级上学期1月期末考试语文试题(含答案) .pdf
- 2024年保险基础知识考试388题ACB[含答案] .pdf
- [医学类试卷]彩色多普勒(CDFI)上岗考试模拟试卷12.pdf
- 2024年高中语文 2.2.1《品质》同步备课教案 苏教版必修3 .pdf
- 2024年六年级科学(上册)期末达标试题及答案 .pdf
- 522-习题作业-业务题库与答案 .pdf
- 中药学试题精选及答案 .pdf
- 《GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业》.pdf
- GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业.pdf
- GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 中国国家标准 GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 《GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法》.pdf
- 《GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数》.pdf
- GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数.pdf
- 《GB/T 17215.686-2024电测量数据交换 DLMS/COSEM组件 第86部分:社区网络高速PLCISO/IEC 12139-1配置》.pdf
- GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜.pdf
- 《GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜》.pdf
文档评论(0)