- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
问答知识库建设说明
问答知识库建设说明 一. 普通一问一答 (无上下文和场景) 问答的编写应注意三个总原则: 1. 越多越好:知识库内容越多,可供调用的信息就越多,相当于大脑越发达。 几万条的库和几十条的库,用起来差别会很大。 2. 前期人工维护:知识库初步使用时还需要人工监测,如调整标准问答的设置, 根据“无效问答”一栏中的内容做增添等。后期这样的工作会逐渐减少甚至 避免。 3. 尽量设置标准问题:便于算法衍生更多问法,减少人工维护量。 具体设置: 第一步:Excel 样表: question answer 法国的首都是哪个城市 是巴黎啦 《白鹿原》是谁的作品 陈忠实 什么季节最热 夏天,北半球的6~8 月 …… …… 格式和操作都很简单,只需在excel 里建立如上的两栏表格,左栏为“question ”, 右栏为“answer ”(表头这两个单词不能省略,且必须为英文),然后在下面依次 列出问答即可。 第二步: 问答库内的问题应设置为“标准问题”,以便计算。有以下几点需要注意: ①使用标准普通话,尽量避免明显的方言或个人习惯用语,如: 你们公司给哪儿旮旯呀? 侬知不知地址啊 伦家想鸡道怎么去了啦 最佳设置应为: 你们公司地址在哪里? 你们公司具体位置在哪里? 贵公司在什么位置? 等 ②标准问题中不要出现错别字,如: 你们公司低 (地)点在哪儿? 几天之内可以退火 (货)? ③尽量设置语法成分较为完整的句子,不要只写短语,如: 官方网站(×) 你们官方网站是什么(√) 微信公众号(×) 你们有没有微信公众号?(√) ④库内问题最好用简明扼要的单句,不要设置内容过于复杂的长句,如: 我想问一下你们正在搞活动的性价比很高的至尊套餐,如果我是会员的话多 少钱?(×) 至尊套餐会员价多少钱?(√) 嗨你好你好你好,你叫什么名字呀?(×) 你叫什么名字?(√) 我上星期在你们网站上买了一个吸尘器,觉得不好用,想问下是不是7 天之 内可以退?(×) 7 天内是否可以退货?(√) 7 天内能不能退货?(√) 7 天内可以退货吗?(√) 第三步:检查 Excel 表格中的问答上传完毕后,可根据自动检索功能提示,修改无法上传的问 题,如减少题目或答案字数等。 注:库内已有的,完全重复的问题无法上传,可以稍作几个字的改动 补充说明: 1. 以上标准是为了与算法相结合,减少人工维护成本,不是硬性要求。如第③ 条,其实也可以将知识库中的问题设置为“官方网站”,那么当问到“你们的 官方网站是什么”时可能无法作答;但如果设置为后者,那么当问到 “你们 的官方网站是”,“你们的官方网站”,“你们官方网站”,“官方网站”均可作 答。 2. 我们的算法会自动处理用户的真实问题语句,进行“模糊”、“去口语化”、“同 意替换”和“容错”等处理,使之趋近于库内标准问题并调出精准答案。也 就是说,库内如果多设置不同问法,回答准确率就能成倍增长。建议前期多 根据“无效问答”维护知识库,增加问题,一劳永逸。 二. 上下文场景限制 (如有需要) 如果需要编辑多轮对话,希望同一个问题在不同语境下呈现不同的答 案,这时就需要用到 “场景”功能。详见下图所示: “场景”的设置也很简单,只要再加一栏“scene ”即可。scene 栏内容最多 不能超过20 个字符,汉字和英文均可。 在不强制场景的情况下,输入 “讨厌”,答案会随机出现;如果自己设置了 场景,就会按照设置出现符合上下文的答案。 建议:如果不是对多轮对话以及上下文有特别的需求,不要设置 scene 栏, 由系统自动判断场景即可。
您可能关注的文档
- 关于举办2011年昌图多媒体课件制作演示大赛的通知.doc
- 跌坎型底流消能流态转捩及控制研究-北京交通大学学报社会科学版.pdf
- 跌坎式底流消能工跌坎深度确定及工程应用-北京交通大学学报社会.pdf
- 关于举办2017常州国际智慧医疗对接会的通知-常州对外科学技术.pdf
- 跌坎型底流消力池水力特性二维数值模拟研究-长江科学院院报.pdf
- 跨文化交际的话语解读再情景化模式-我的话语分析.pdf
- 跨学科创新视角下创客教育与steam教育的融合-华东师范大学学报.pdf
- 关于举办云计算行业概述培训班的通知-海淀创业园.doc
- 跨语言知识图谱构建.pdf
- 跳频技术frequency-hoppingspreadspectrumfhss在同步且.doc
文档评论(0)