基于数据挖掘的接触网检测数据处理方法研究.pdfVIP

基于数据挖掘的接触网检测数据处理方法研究.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘的接触网检测数据处理方法研究

科技创新 20l2年7月(上)l科技创新与应用 基于数据挖掘的接触网检测数据处理方法研究 田国保 (中铁建电气化局集团南方工程有限公司电气化分公司,湖北 武汉 430074) 摘 要:在接触网检测的数据处理过程当中合理使用数据挖掘技术,第一步就是要预处理那些很原始的数据,并且为数据挖掘的 过程做好充足的准备,第二步就是使用聚类的方法把所需要检测的数据按照空间的位置进行分类,之后就可以得到聚类结果,第 三步就是对检测的数据进行线性回归,这样就可以得到检测参数的所有数学模型。 关键词 :数据;处理方法;检测 ;研究 ;接触网 在当今智能系统的理论以及实际的技术内容当中,数据挖掘技 初始的原形,之后使用K—means进行处理,得到聚类的结果。 术属于一种很先进的技术,综合使用了智能化、数据统计以及神经 3接触网检测数据挖掘算法的描述 网络等等技术,从而在所收集的大量数据当中发现那些隐含的,而 3.1层次聚类,得到类的个数 且是有价值的信息。本文把数据挖掘技术运用于接触网检测车检测 假设有n组数据,可以把各组的数据当做一个类别,这样就有n 数据处理中,通过对接触网检测数据进行数据挖掘分析,得到隐含 个类别。先找到距离最近的两组数据,然后合并成为一个组,成为新 的知识关系,建立相应的数学模型,以便根据接触网的动态特性,采 组。之后再像这样一个个继续合并,直到数据间的距离大于阈值T, 用最有效的维护方式。 就把之前的数据作为一类;重复上面的做法,归类所有的数据。由上 1接触网检测数据的预处理的内容 可知,在层次聚类的算法当中,阈值T很重要。如果所找到的T值很 1.1数据的清洗 合适 ,就成功了。T值要根据实际的情况来进行调整,类的数量少 这部分的工作首先要做的就是去除原有数据当中的没用的数 了,加大T值,类的数量多了,减少T值。 据以及噪声的数据,并且要做好遗漏数据的处理工作以及脏数据清 3.2使用 K—means算法来得到最终结果 洗的工作 ,之后要把空 白的数据都清除掉 ,把背景的噪声也要处理 由于在聚类前,无法确定类数的,可先假设聚类的个数,然后再 掉,并且要考虑时间的顺序以及数据的变化所带来的影响。检测车 进行运算,通过聚类的效果来判定假设是否正确。K—means算法便 检测到的接触网参数,可以通过 自带的专家系统对单项数据进行判 采用的是这种方法。K—means算法 以k为参数,把 n个对象分为k 断。对于远远大于或小于正常数值的检测数据,表明这段接触网可 个簇,以使类 内具有较高的相似度,而类间的相似度最低。相似度的 能存在故障。因此在进行聚类分析的时候,出现了故障的数据我们 计算根据一个簇中对象的平均值(被看作簇的重心)来进行。 是坚决不能用的,要不然所处理的结果的偏差会很大,结果会是错 f1)处理后的数据可以看成是一个样本空间,记为x。初始化 k 误的,这就是必须清洗故障数据的原因。 个原形 wl,W2,……,Wk},其中 Fil∈{l,2,··… ,·kl,l∈{1,2,……,n 1.2数据的规约 } 对大量的接触网检测数据进行复杂的数据分析需要比较长的 (2)使每一个聚类C与原形w.相对应,构成新的样本空间 时间,所以这种分析的方式并不可行。而数据归约的技术不需要太 (3)每一个输入向量 iI,其中l{1,2,… ·一,nl,求出i到每个原形 长的时间,可以得到数据集的归约表示 ,但是需要把握保持数据完 的距离。并将 i。分配给最近的原形w;所属的聚类 Cj。即 整性的原则。在归约后的数据集上来进行挖

文档评论(0)

ufank86048 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档