- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于集对分析的半监督ISODATA聚类.pdf
ComputerEngineeringandApplications计算机工程与应用 2009。45(36) 99
基于集对分析的半监督ISODATA聚类
魏小涛
WEIXiao—tao
北京交通大学 软件学院,北京 100044
SoftwareSchool,BeijingJiaotongUniversity,Beijing100044,China
E-mail:weixt@bjtu.edu.an
WEIXiao—tao.Semi—supervised ISODATA clustering based on setpairanalysis.Computer Engineering na d Applications,
2009.45(36):99—100.
Abstract:A semi—supervised ISODATA clusteringalgorithm based on the SetPairAnalysis (SPA) isproposed fornewtork
anomaly detection.Thispaperimprovesthe originalISODATA algorithm mainly in threeaspects.Firstly,the modified algorithm can
directlyprocessthemixed attributesofsymbolic and numeric values,and employ the SPA to calculatethedistance between data
records.Secondly,the algorithm can processboth labeled and unlabeled samples.Th e smallportion oflabeled samples isused to
supervisehte clusteringprocessin the splitting stage.Th irdly,the initialparameters needed to be inputinto the algorithm are re—
duced to only two.Experimental resulton the KDD 99 intrusion detection datasetsshowsthatthe algorithm has high detection
rate(95.62%)whilemaintainingalowfalsepositiverate(1.29%).
Key words: set pair analysis;network anomaly detection;semi—supervised clustering;Iterative Self-Organizing Data Analysis
Technique(ISODATA)
摘 要:提出一个基于集对分析的半监督 ISODATA聚类算法,用于网络异常检测。在三方面进行了改进 :首先,算法能够直接处理
字符数字混合属性的数据,并使用集对分析来计算数据记录之间的距离;其次,算法同时处理有标号和无标号的数据,并利用少量
的有标号数据来指导算法的分裂过程;最后,将算法的输入参数减少到只有两个。在KDD99入侵检测数据集上的实验结果显示,
该算法获得了95.62%的检测率和 1.29%的误报率。
关键词:集对分析;网络异常检测;半监督聚类;迭代 自组织数据分析方法(ISODATA)
DOI:10.3778/j.issn.1002—8331.2009.36.029 文章编号:1002—8331(2009)36—0099—02 文献标识码:A 中图分类号:TP18
1 引言 动态合并与拆分来 自动决定聚类的数量;为了能够处理混合属
传统的聚类算法一般是指在没有任何数据的先验信息下 性,文献6【—9】提出了不同的距离函数来衡量符号属性值之间的
对数据进行聚类分析,因而又称为无监督学习方法。但是在实 差异。然而将这些算法单独应用于网络连接数据则不能取得满
际应用中,这种聚类方法往往得不到有效的聚类结果。实际上, 意的效果,显然,应该将这些算法的优点相结合,并充分运用少
在进行聚类时,总能获得一些知识,如领域的背景知识或者小 量的指导知识,才能获得相对较好的结果。
部分有标号
您可能关注的文档
最近下载
- 22G101 三维彩色立体图集.docx VIP
- DB41T2454-2023 测量仪器检定校准证书有效性确认技术规范 (2).pdf VIP
- 全过程工程咨询流程.pptx VIP
- (完整版)初中物理新课标解读.pptx VIP
- 火电厂湿法脱硫脱硝石膏中氯离子的去除工艺、药品方法.pdf VIP
- 《党政主要领导干部和国有企业领导s人员经济责任审计规定》释义.doc VIP
- 2025年全国普通高校招生全国统一考试数学真题(新高考Ⅰ卷)(含答案).pdf
- T_JAASS 164-2025 零碳农业园区创建与评价技术规范.docx VIP
- 品牌代理合同范本.docx VIP
- 标准与标准化知识.ppt VIP
文档评论(0)