QuestionAnsweringSystem技术实现分析.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
QuestionAnsweringSystem技术实现分析

QuestionAnsweringSystem 技术实现 @mr.cc 1 QuestionAnsweringSystem 是一个Java 实现的人机问答系统,能够自动分析 问题并给出候选答案。本文从工作原理、主要数据结构、关键技术及代码实现四 个方面对该系统的技术实现进行分析。 1、工作原理 本地数据库 是 问题输入 本地数据库 是否存在证据? 否 预处理 从互联网检索 并抽取问题的证据 添加问题,证据 检索并返回问题的证据 提取问题模式 支持证据 问题类型 模式匹配得到 证据评分 模式集合 问题类别 候选答案提取 TopN答案 候选答案评分 候选答案排序 及其置信度输出 图 1 QA 系统工作原理 该QA 系统的工作原理如图 1 所示,主要可以划分为证据获取、证据评分、 问题分类、候选答案评分四大模块。这四大模块的目标及内容如下:  证据获取:从本地数据库或互联网上获取支撑问题的证据。若本地数据 库存储有该问题的证据,则直接返回支撑问题的证据。否则,需要利用 有哪些信誉好的足球投注网站引擎 (如百度、谷歌)从互联网上抓取与该问题相关的片段,并抽 取、整理出其中的正文作为该问题的支撑证据。  证据评分:为评价不同证据对问题的支撑度,需建立一套证据评分机制。 1 项目作者:杨尚川;项目地址:/ysc/QuestionAnsweringSystem - 1 - 证据评分模型,采用了基于词频的、基于 bigram 的和基于 skip-bigram 的三种评价方法及基于上述三种方法加权的组合方法。评分过程中,可 以由用户设定以上四种评价方法的任意一种。  问题分类:对问题所属的类别进行判定。该系统将可识别的问题类别划 分为人名、地名、机构名、数字、时间、定义和对象七类(暂时仅支持 前五类),并预先定义这几类问题的匹配模式。分类过程为:1)提取问 题的模式,2 )和预定义的问题类型模式进行正则匹配,3 )根据匹配的 结果确定问题的类别。针对同一类问题,系统又定义了五大类数小类的 匹配模式,用户可以自由设定匹配模式为大类别或基于五大类的加权组 合。  候选答案评分:为评估候选答案的质量,需建立一套候选答案评分机制。 在候选答案评分模型中,基础的评价方法有基于词频的、基于词距的、 基于最短词距的、基于文本对齐的、基于宽松文本对齐的、基于回带文

文档评论(0)

hello118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档