- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改进的optics算法及其在文本聚类中的应用_曾依灵
22 1 Vol.22, No.1 2008 1 JOURNAL OF CHINESE INFORMATION PROCESSING Jan., 2008 :1003-0077(2008)01-0051-05 OPTICS 1, 2 1 1 , , (1. , 100080;2. , 100080) :基于密度的OPTICS 聚类算法以可视化的结果输出方式直观呈现语料结构, 但由于其结果组织 略在处 理稀疏点时的局限性, 算法实际性能未能得到充分发挥。 本文针对此缺陷提出一种有效的结果重组织 略以辅助 稀疏点的重新定位, 并针对文本领域的特点改变距离度量方法, 形成了 OPTICS-Plus 文本聚类算法。在真实文本 分类语料上的实验表明, 我们的结果重组织 略能够辅助算法产生更为清晰反映语料结构的可达图, 与 -means 算法的比较则证实了OPTICS-Plus 具有较为良好的聚类性能。 :计算机应用;中文信息处理;OPTICS 算法;密度聚类;文本挖掘 :TP391 :A OPTICS-Plus for Text Clustering 1, 2 1 1 ZENG Yi-ling , XU Hong-bo , BAI Shuo (1.Research Center of Information Intelligence and Information Security, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100080, China; 2.Graduate University, Chinese Academy of Sciences, Beijing 100080, China) Abstract:As a density-based clustering algorithm, OPTICS is capable of showing the intrinsic corpus structure within a visual plot.However, due to the improper strategy in organizing the points in sparse space, the algorithm does not reach its best performance.To solve this problem, we proposed an effective result-reorganization strategy for reordering those sparse points.Based on this strategy, a new text clustering algorithm named OPTICS-Plus was proposed according to the characteristic of text mining fields.Experiment on FuDan text classification corpus show s that our result-reorganization strategy is capable of helping the reachability plots generating clearer view s of corpus structures.Furthermore, a comparison with -means proves that the clustering performance of OPTICS-Plus is
您可能关注的文档
最近下载
- 铁道概论2.2中国铁路建设.pptx VIP
- 亚朵人才发展计划--酒店管理资料.pdf VIP
- 3.1订立合同学问大课件-高中政治统编版选择性必修二法律与生活.pptx VIP
- DB6110_T 60-2024 商洛市全域森林康养试点市建设规范.docx VIP
- 湖南省自然资源确权登记专业实务试题一.docx
- 水工建筑物课件-水工隧洞.ppt VIP
- 全国青少年机器人技术等级考试实操题(三级20180317).docx VIP
- 2025年检验科实验室管理与质量提升计划.docx VIP
- 安徽建工集团各类通知及管理办法相关知识试卷.doc
- DB12_599-2015_城镇污水处理厂污染物排放标准_天津市.docx VIP
有哪些信誉好的足球投注网站
文档评论(0)