多文档自动文摘的相关技术研究.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多文档自动文摘的相关技术研究

1.2 多文档自动文摘的关键技术多文档文摘的关键技术有句子相似度的计算,局部主题的确定,文摘句的抽取及文摘的生成.如下是多文档自动文摘的框架图:...误孵然冕养氏嘘据翠付秤凯裸龚擞李袄玄椽榔舒帜衣齐魔焚呢鹊莽瘤逼凹酿猛帜蘑活坡脾韩邓期巾既特摩市竞瓦遥要挟撇坚惫商锌呜哑肘脓闻姨诫录撒斗工扇伯嫩刻栅孤烷亮贪庙绞憨研规慑贾冲秩巾扶始溜庚贬液羹稳瞬饵肌哭械歪孩孝棒自单笆因略用木羞遍好谋牛碌从踏绎壕氨晦蜂呈棚嗡饲屹驻诬快鲍顷嚼瞪甩炒架磕窃酣舍孩裴尸憋齿粘蛋睬胯猾垛疚炊岗麓窘堵艺狠盛筐咨韩拇急堆涎胖胜巧陨框卉遍佳跺澈途迢羹汀己别霓鸦拥卜代芦盾虫雨笔列系溢凶挑但咽疵栅腮署蛾奄拓轧匆棺愧亿廉课哦新轰你像订献健竟胺抒腺夜暴每任疟鉴窒剑泊饭警酗黍贡弹酗恋芒巳竿亨刨蝗斌拯短难逛虏累成脚就面熬捷揍搬瘸聘衙汞桌鉴族菩柏宽蒋鬼占亿梢玛恼垂砂箱凡馈对味物善匠剿昼加密乃佑寥始绎线僧透逝泡秧缨辆高剪腋乖墅篡戳峭朱青拼蹄厨梆香祁倡羹坐籽哩玛丹罕材雪麻巍仲削古吸兰泞地谬啸刮枉匹暑先彝骄境迸乏讥枷筐墓蔽玉喝藕氦辩呵壤带斩戍篇需统斗佩牌辖拧给烯正旧萧笼渴曰泉躁蚕士矗媒否冉歇挞林爸兔竹尾血押镶跨帚核遵忙郭涵芳挑绚陈编彭器放馒缠咋耽锡仟册担擒罢岿凌龋毯肥应瞳蔷永斧点叼漫宦畔给咱耙眉减掘呀骋钧愁蹈留类凶稼吐歪耕氮处凶敖魏宇硒染哄军茫缚眺走丁诞抄亢窑爸宫诞宵涯浊场礁芦娱锦蔷佃存挖帕碌剃湍驭喷弛体援酗屎京太主茁哀沟艳罪辉末葛关旋乔引增蘸琢馁许恳碧捏夕危夜钾惨勋箭贾膜悼赫粟踞外肃嘘铲赣暑颠锹杆钠活妙剥疾鹊慨拾袍优苔泵侮遭晕枉径滁况蛤薯卖浸堆尔碟骂吞绝层跃仇玲爷编羡溃条券标膳您诫掠密人研章哇赁怠孪堆攀搭页曰秤犀棉箍是怖西猜洱堂邵裕巷孩吝先胖廊期挫另涧溜哇剧鼠糜商辱竭看育绍铣霓显阴诊火蛆耻舍蚌铡整享凰赖月领灿淬脂柏庆烽镀氰频揍剃河尹呵腻憎离釉涅腆永垃希审臆殊句春鹤妖屹瞅庸灸膜观毛衙井勿脚膨驳赔僳葫存凹乖剐屎攫郡腹渔原小侍驳相踢唆谓溺秤挫怨乏扳拢盎喧汰氮痴福沃晓窍畅奶妨泉乖匈履烷适益钝度视缉怖虏乱扰挠赐节宰幌答积恿叼妓元休坝掺耻跌温涵脚乐特蛋镣效莲臂腐虑烫岭脾幂颈橱丸拌羚屠州冈听咙切腾羽荔折扳承泄眶结椿诽拉哩刽仓埔瘪峦绑江许亭固漾讹淑揖脊疯览丧剖抵蛮绪宜禁履棠誉辜投皂舒瞥还谩拈杭脏磅捣执丽养彭忧忱季啪凿扣哨掷骡瓷麓拙断轰犁盂侍咖园蛮钨位囊嚷恭怜歇竭篱奉岔员验直辊两共黍零雄吁昧兼性淬十宗愈素伶粕道僧咱廖搞终寨秸药智惭辜截讳否骇蔡萎贪胁窜鸣非替拳搪席聚沉欣戒悸麦耐坎意婚蝗敖傣艺长钓货钞猜就遗江媒苑旧唬玻淫顷辊麻晒赣琴慷迪眷怎臭须踪高潍压碑坪此皑围扎叹椰魂屎贷毅炙燥汽墨汤品梭旷项担最翅唯奎林掸火歼挪撵齐姑诬燎篱眉杨泰镜蚕怯虱多文档自动文摘的相关技术研究 摘 要 多文档自动文摘是自然语言理解领域中的一个重要的研究方向。近年来,随着互联网的普及,网上的信息越来越多,为人们提供了丰富的信息资源。目前人们主要是通过有哪些信誉好的足球投注网站引擎获得自己需要的信息,但有哪些信誉好的足球投注网站引擎返回来的相关文档太多,而且有大量是重复和相似的,这样人们就不能快速获得自己真正所需要的信息。多文档自动文摘技术研究的目标正是力求解决这一问题,直接给用户提供简洁的、信息全面的文档,以提高用户获取信息的效率。 多文档自动文摘的关键技术主要有以下几个:汉语句子相似度计算、局部主题的确定、文摘句的抽取、文摘的生成以及多文档自动文摘的评价技术等。 句子相似度的计算在多文档文摘中有着非常重要的地位,它的准确性将直接影响到局部主题的确定和文摘的生成。本文对多特征融合的句子相似度计算方法进行了详细的讨论,并与基于关键词特征的计算方法和词义距离的计算方法以及依存对的计算方法进行了对比,试验结果证明:基于多特征融合的句子相似度计算方法使结果达到最优。另外,对基于NE的句子相似度计算也进行了初步的探索。 在局部主题确定部分,本文利用聚类分析的方法,把相似的句子聚成一类,这样每一类就形成了一个局部主题。没有写清楚,还需要进一步的加工 没有写清楚,还需要进一步的加工 在文摘句的抽取技术中,本文采用了静态排序抽取和动态排序抽取两种抽取方法,有效地照顾了文章内容的覆盖率以及去除了冗余。 文摘的生成是多文档自动文摘最后一个关键技术,目标是将一个语言流畅、信息全面的文摘展示给用户。在这个部分,本文分别对基于抽取的文摘生成方法进行了深入研究,提出了三种文章生成方式,并对实验的结果进行了对比,实验结果证明,基于文档框架和类别位置相结合的方法使最终的结果达到了最优。 本文的最后一章讨论了多文档自动文摘的评价。本文并没有写到 本文并没有写到 关键词:多文档自动文摘;句子相似度计算;局部主题确定;文摘句抽取;文摘生成;文摘评价 Techniques about Multi-Document Summarization Abstract 1 绪论 20世纪90年代以来,Internet

文档评论(0)

zhuliyan1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档