- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于LDA的潜在语义区划分及Web文档聚类算法
第25卷第l期 中文信息学报 V01.25.No.1
11
201 PRoCESSINGJan.·20
1年1月 J()URNALOFCHINESEINF()RMATIoN
文章编号:1003-0077(201I)01-0060—06
一种基于LDA的潜在语义区划分及Web文档聚类算法
刘振鹿1,王大玲1’2,冯时1,张一飞h2,方东昊1
(1.东北大学信息科学与工程学院,辽宁沈阳110819;
2.医学影像计算教育部重点实验室(东北大学),辽宁沈阳110819)
摘要:该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频,中频、高频语义区,以低频语义区
的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作
用机制对聚类结果进行修正。与相关工作比较。该文不仅应用LDA模型表示文档。而且进行了深入的语义分布区
域划分,并将分析结果应用于Web文档聚类。实验表明,该文提出的基于LDA的文档类别与语义互作用聚类算
法获得了更好的聚类结果。
关键词:LDA;潜在语义;语义分布;文档聚类
中图分类号:TP391 文献标识码:A
Web
An ofLatentSemanticPartitionand Document
Approach Space Clustering
LIUZhenlu‘.WANG Shil,ZHANGYifeil”,FANG
Dalin91”,FENG Dongha01
(1.SchoolofInformationScienceand 110819,China;
Engineering,NortheasternUniversity,Shenyang,Liaoning
ofMedieal
2.KeyI。ahoratory ImageComputing,NortheasternUniversity,
ofEducation l10819,China)
Ministry Shenyang,I,iaoning
semanticsofdocumentsand thesemantic
Abstract:This theLDAmodeltO latent partition
paperapplies analyze
into and semanticsinlow areusedtOdetectoutlier
low,middlehigh space.The frequencyspace
space frequency
in aredevotedtodocument asfeaturesof
webdocuments.Thesemanticsmiddleand
highfrequencyspace clustering
您可能关注的文档
- The Influence of Tourism Development on Mosuo Culture.ppt
- The Role of Vorticity Dynamics in Vortex Breakdown.pdf
- The Service Configurator Framework An Extensible Architecture for Dynamically Configuring C.pdf
- The Subjects of International Economic Law 马冉.ppt
- The Stochastic Dynamics of Rectangular and Vshaped Atomic Force Microscope Cantilevers in.pdf
- The Use of Indirect Evidence for Bayesian Reliability Analysis.pdf
- The Watermark Evaluation Testbed (WET) New Functionalities.pdf
- the 基于多视点视频编码宏块模式选择的快速算法guide download.pdf
- the 温室甜瓜加氧灌溉综合效益评价guide download.pdf
- Theoretical and Empirical Analysis of Injection Mold Casting System Design.doc
最近下载
- 2024年大学生预防艾滋病知识竞赛判断题库及答案(共100题).doc VIP
- 家长会防性侵安全教育.pptx VIP
- T CACM 成年人中医体质治未病干预指南.pdf VIP
- 心血管系统疾病3-风湿病与心瓣膜病课件.ppt
- 2024届高考语文复习:散文阅读+课件.pptx VIP
- 食品经营许可和备案管理办法(100题).docx
- Q∕GDW 11059.2-2013 特高频法局部放电带电检测技术现场应用导则.pdf
- 初来乍到第一季(中英对照台词)Fresh Off the Boat S01.pdf
- T CACM 食管癌前病变治未病干预指南.pdf VIP
- 部编版语文三年级上册看拼音写词语全册汇总(练习+答案).pdf VIP
文档评论(0)