- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文BIog热门话题检测与排序技术研究
丁伟莉,赵华,郑德权,赵铁军,于浩
教育部·微软语言语音重点实验室,哈尔滨工业大学,150001
E-maih
wldin£@mtlab.hit.edu.cn
摘要:Blog(博客)作为一种全新的网络发布模式,在很大程度上增强了网络信息的开放性,也使得Blog空
间里的信息量成倍增长。利用话题榆测技术将Blog文本信息按照所表达的话题进行归类和组织,可以使用
户在这种动态变化的环境下查看自己感兴趣或需要的信息,使Blog信息更加有效,准确地为用户使用。本
文根据Blog本身的特点.对向量空间模型的表示和相似度的计算进行了改进.提jn了一种应用于Blog中
的热门话题检测与排序方法.实验结果显示此方法取得了较好的结果.
关键词;Blog,热门话题检测.话题排序.向量空间模型.相似度
ResearchonHot Detectionand inChinese
Topic Ranking Blog
Weili,Zhao Hao
Ding Hua,ZhengDequan,ZhaoTiejun,Yu
MOE·MS ofNatural and
KeyLaboratory LanguageProcessingSpeech
Harbin
InstituteofTeehnology,Harbin,150001
is anovelindividual modeloverInteractwhilemakesmoleandmore
becoming publication
Abstract:Blog
to
informationandusefula the detection to and the
classify
open greatextent.Utilizingtopic techniques organize
canmakethe gCCeS$the arcinterestedinand
text HSCrStO information needunderthe
by
Blog topic they dynamic
informationCallbeused and onthefeaturesof
environment,therebyblog effectivelyexactly.Based blog
doessome invector modeland Uhot
information,this space
paper improvement similarity,andproposedtopic
and melhod
detection usedin methodhasbeentestedanditshowseffectiveresults.
ranking btog.The
Keywords:Blog;hottopicdetection;topicranking
文档评论(0)