面向网络社区问答对的语义挖掘的研究.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
国内图书分类号:TP319.4 学校代码:10213 国际图书分类号:681.324 密级:公开 工工工学学学博博博士士士学学学位位位论论论文文文 面向网络社区问答对的语义挖掘研究 博士研究生:王宝勋 导 师:王晓龙教授 副 导 师:刘秉权副教授 申 请 学 位:工学博士 学 科:计算机应用技术 所 在 单 位:计算机科学与技术学院 答 辩 日 期:2013 年3 月 授予学位单位:哈尔滨工业大学 Classified Index: TP319.4 U.D.C: 681.324 Dissertation for the Doctoral Degree in Engineering RESEARCH ON THE SEMANTIC MINING OF QUESTION-ANSWER PAIRS IN WEB COMMUNITIES Candidate: Baoxun Wang Supervisor: Prof. Xiaolong Wang Associate Supervisor: Associate Prof. Bingquan Liu Academic Degree Applied for: Doctor of Engineering Specialty: Computer Application Technology Affiliation: School of Computer Science and Technology Date of Defence: March, 2013 Degree-Conferring-Institution: Harbin Institute of Technology 摘 要 摘 要 Web 2.0技术的飞速发展带来了互联网中的用户生成内容(User-generated Contents, UGC) 的规模的不断增长。作为一种新的网络信息资源,高质量的用 户生成内容的研究和应用价值正逐渐显现,针对其开展的采集和挖掘工作具 有非常重要的意义。由问题和其答案组成的问答对是用户生成内容的典型代 表,是用户之间以互联网为媒介的知识分享行为的直接产物,因而由大量用 户生成的问答对组成的问答资源是人类知识以网络文本为载体的体现形式之 一,同时也蕴含着人类在通过网络进行交流过程中的语言规律。因此无论对 于问答系统的构建还是自然语言处理研究来说,优质的问答资源都具有举足 轻重的地位。 网络社区(如社区型问答系统、在线论坛等)为互联网用户提供了信息交 流的平台,用户在其中的知识交流和分享活动多是以提问和回答的形式进行 的,因此网络社区中蕴含着大量的问答对资源。网络社区中存在数量可观的 描述型问答对,这种问答信息的价值在于其有助于弥补现有自动问答系统在 复杂问题上的不足,从而提高自动问答系统的整体表现。然而由于网络社区 中的知识分享并不存在义务性,有价值的问答信息往往混杂在大量的无意义 信息之中,因此对于问答知识库的构建研究来说,从包含着大量噪声信息的 网络社区内容中自动识别和抽取问答信息是一个具有挑战性的任务。 本文主要研究面向网络社区问答对的语义挖掘中的关键问题。面向网络 社区问答对的语义挖掘研究不仅包含基于语义关系的社区问答对自动识别, 同时也包括利用问答对中蕴含的语义知识进行问答信息的生成及融合等任 务。具体地,本文的主要内容包含以下4 个方面。 问题和答案之间的语义相关度计算是社区问答对语义挖

文档评论(0)

liybai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档