- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
文本主题段落内部概念关系抽取技术研究 摘 要 随着计算机的普及和互联网的迅猛发展,网络上文本信息的数量 快速增长,然而人们却很难迅速地找到所需的信息。为了改变这种尴 尬的局面,迫切需要一些自动化的工具帮助人们在海量信息中迅速而 准确地找到用户真正需要的信息,信息抽取技术就是在这一背景下产 生出来的。互联网上信息又大多以文本形式存在,而文本从线性和层 次角度上可以分为若干个段落主题。由于标引段落主题的概念之间存 在某种关系,作者抽取出段落主题概念及其之间的关系,就为基于段 落主题的信息检索以及文本自动摘要工作提供了一个新的途径。 本文的研究工作是基于主题段落的概念和概念关系抽取技术研 究。主题段落概念及其关系抽取简单来说,就是从文本段落内部挖掘 出能反映文本内容的若干个主题概念,并构建出这些概念之间的关 系。首先为了抽取出标引文本主题的概念,我们通过词聚类的方式获 取概念,在构建向量空间模型(VSM )时,原本的以词形为基础的向 量空间模型就变成了概念空间模型。然后利用知网中概念词之间的相 似度,加权计算出向量空间模型中各个分量的权值。 随后,不同于以往的词频加权算法,本文提出了基于词语量化关 系的主题概念抽取算法,通过定量的分析概念之间的相关信息,抽取 出更能准确标引文本主题的概念。首先利用一部中文词典《现代汉语 规范词典》——一种非结构化的数据源作为背景知识,来挖掘词语之 间的量化关系。然后利用这种量化关系为概念向量模型中概念分量构 建相关向量,再通过对概念相关向量和权值的计算,得出每个概念对 于文本的主题重要度,最终依据重要度抽取出能够标引文本主题的概 念。 III 对于抽取出来的主题概念,使用基于特征向量的机器学习方法抽 取出主题概念关系。选取主题概念上下文的词语和词性作为特征向 量,抽取出比较常见的若干种概念关系。 关键词:主题概念,词语量化关系,概念向量模型,概念关系 IV Research of conceptual Relation Extraction Based On Topic-text Paragraph ABSTRACT With the quick expanding of the Internet information resource, the number of texts increases rapidly. People hardly can find information which they need quickly. In order to solve the problem, we urgently need an automated facility to help users make use of current Internet information to gain really useful information. Research on information extraction emerges under this background . Most of the Internet information exists in the form of text which could be divided into several topic -text paragraphs . Subject concepts and concept relations extraction provides a new way for information retrieval based on paragraph topics and text automatic abstraction. The research work of this paper is a research on topic conceptual and conceptual relation
您可能关注的文档
最近下载
- 房产税城镇土地使用税政策讲解.pdf VIP
- 《弟子规正版全文-带拼音-完善打印版》.docx VIP
- 新大学日语阅读与写作1东娜练习答案及译文.pptx
- 第19课 法国大革命和拿破仑帝国 课件(共33张PPT).pptx VIP
- 施工现场节假日前安全检查表.doc VIP
- 500kV龙昌Ⅰ、Ⅱ号线直线塔绝缘子单串改双串施工方案.pdf VIP
- 结构优化的群体智能优化算法研究.pdf VIP
- 新视野大学英语(第四版)读写教程1(思政智慧版)课件 B1U1 Section A Fresh start.pptx VIP
- 北京-407EV-标准版-BJ5030XXYVRRC-BEV-407EV纯电动汽车产品使用说明书.pdf VIP
- GB50666混凝土结构工程施工规范.pdf VIP
文档评论(0)