- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
异构数据库相似语义属性聚类过程研究.pdf
第 9卷 第2期 铁道科学与工程学报 VOI.9 NO.2 2012年4月 JOURNALOFRAI \『,AY SCIENCEAND ENGINEERING Apr.2012 异构数据库相似语义属性聚类过程研究 李小平。任恩恩 (兰州交通大学机电技术研究所,甘肃 兰州730070) 摘 要:对异梅数据库柄似语义属性聚类过程及其关键技术进行研究,在词频 一逆文件频率的基础上,提 出数值类型属性 信息的槽频率一逆文件频率处理方法,分剐应用于文本信息和数值信息的相似语义属性聚类过程。研究结果表明:使用词 频一逆文件频率和槽频率一逆文件频率方法拥结合是异构数据库相似语义属性聚类实现的一种有效方法。 关键词 :异构数据库 ;相似语义;属性聚类;统一矢量化;词频一逆文件频率;槽频率一逆文件槽频率;自组织映射网络 中圆分类号:TP391 文献标志码:A 文章编号:1672—7029{2012102—0119~06 Researchofsimilarsemanticattributeclusteringprocessinheterogeneousdatabase LIXiao—ping .REN En—en (MeehatroniealTRInstitute,Lan~ouJiaotongUniversity,Lanzhou730070,China) Abstract:Thekeytechnologyofthesimilarsemanticattributeclusteringprocessintheheterogeneousdatabase wasresearched.Onthebasisofhteterm frequency—inversedocumentfrequency,theprocessingmethodofbin frequency—inversedocumentbinfrequencywasproposed,whichwasappliedinsimilarsemanticattributecluste— ringprosessofthetextinformationandnumericalinfomr ation.Theresultsshow thatthemethodusingtemr fre— quency ——inversedocument~equencyandbin ~equeney—·inversedocumentbin ~equencyiseffective to the processofhtesimilarsemanticattributeclusteringintheheterogeneousdatabase. Keywords:heterogeneousdatabase;similarsemantic;attributeclustering;unifiedvector(UV);term~equen— cyinversedocument~equency(TF—IDF);bin~equency—inversedocumentbin~equency(BF—IDBF);self — organizingmappingnetwork(SOM) 聚类是数据挖掘的一个关键领域,同时也是异 档表示、文档特征提取和聚类几个阶段;文献 [5] 构信息共享过程中的一个关键问题…。由于文本 将文本属性聚类预处理过程分为分词、词根还原、 信息是 目前最主要的信息载体,因此,国内外对信 停用词过滤、降维、权重计算等步骤;文献 [6]针对 息聚类的研究大都集 中在文本聚类方面。文献 异构数据,将预处理阶段分为文本数据预处理和数 [2]将聚类分为文本提炼和聚类2个模块;文献 值数据预处理,使用改进的自组织映射 (Self—or— [3]针对中文单词和英文单词的属性区别,将中文
有哪些信誉好的足球投注网站
文档评论(0)