结构健康监测系统的数据异常识别.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
结构健康监测系统的数据异常识别   摘要: 结合机器学习方法对结构健康监测系统采集的原始数据进行初步的自动化分析,以达到降低进一步分析的计算量、提高分析子系统精度的目的.以上海中心和兰州西站监测系统为背景,利用机器学习方法研究数据异常识别问题,优化数据分析预警子系统.使用单变量特征选择提取利于识别的特征向量, 对比分析在结构健康监测中各类支持向量机(Support Vector Machine,SVM)的优劣,组合利用不同SVM的优势减少异常数据的漏报和误报.该方法已被应用于上海中心和兰州西站的结构健康监测系统中.   关键词: 结构健康监测; 数据识别; 单变量特征选择; 支持向量机; 主成分分析; 机器学习; 数据降维   中图分类号: TU312.3 文献标志码: B   0 引 言   自20世纪70年代以来,结构健康监测逐步进入土木工程领域,使结构维护、预警、状态评估具有较可靠的指导.随着计算机和网络技术的飞速发展,监测系统也应运而生.[1-2]在结构损伤识别和预警问题上,国内外学者先后将神经网络算法[3-4]、模糊理论[5]、小波分析[6]和遗传算法[7]等运用于分析预警子系统中.但是,大型建筑结构健康监测产生的数据量巨大,以上海中心为例,应布置400多个测量点位,其中频率100 Hz的动态点位超过150个,每天产生数十GB数据量,若直接将数据应用于结构模态识别计算分析,进行损伤识别,其计算量十分惊人.现阶段,普遍采用方法的是利用定值的信号阈值进行数据筛选,结合人工定时选取某段时间数据进行计算分析,因此效率较低且易漏报和误报异常数据.进行初步的数据异常识别有助于缩小分析范围、降低计算负荷.曾有学者针对桥梁结构提出数据异常诊断方法,但经过上海中心监测数据测试发现此方法对于建筑结构效果不佳.本文旨在对监测数据进行第一层的异常识别,提供对内的预警,降低分析子系统的计算压力.   1 特征向量降维方法   监测数据的统计特征众多,采用一定的数据降维方法处理后可得到正常数据与异常数据之间差别更明显的统计特征,即对异常识别来说更有效的特征值,便于数据分类.同时,特征向量维度降低,进一步分析时计算量将显著降低.本文对比主成分分析(Principal Component Analysis,PCA)法[8]与单变量特征选择(Univariate Feature Selection,UFS)法[9]2种方法,结合实际数据分析其在结构健康监测中进行特征向量降维的优劣.   1.1 主成分分析法   PCA法将数据矩阵   [WTHX]X[WTBX]的行视为来自p个随机变量x的观测值,降低   [WTHX]X[WTBX]的维度主要通过线性组合实现,将n维特征向量映射到k维上(kn),这k维特征称为主成分.此方法的核心目标为寻找能够说明x取值最大变化的线性组合,即寻找具有最大方差的线性组合,是以最大方差理论为基础的选择标准.设数据特征矩阵标准化后形式为   1.2 单变量特征选择法   UFS法能够对每一个特征进行测试,衡量该特征与响应变量之间的关系,根据得分去掉可分性不好的特征.分类问题可采用方差分析对特征进行打分.   方差分析用于2个及2个以上样本均数差别的显著性检验,其将总的试验数据的波动分为反映因素水平改变引起的波动和反映随机因素引起的波动,然后进行比较判断.   2 数据识别方法   利用统计学习的分类方法,依据监测数据特征值向量对每段监测数据进行分类,可达到识别异常数据的目的.[10]   2.1 支持向量机原理   支持向量机(Support Vector Machine,SVM)[11]是一种二分类模型,其基本模型是定义在特征空间上的间隔最大线性分类器.SVM的目标便是寻找所有可将2类数据分离的超平面中基于支持向量几何间隔最大的一个,为约束最优化的问题.实际数据常常不会是完全线性可分的,若去掉少量点后能变为线性可分的数据集即线性近似可分,可使用松弛变量,并引入惩罚参数C0,使原问题的间隔最大化变为软间隔最大化.对于完全线性不可分数据,引入核技巧可使其成为实质上的非线性分类器.   2.2 非线性分类SVM   动态监测数据的数据种类繁多,且在建筑施工或使用过程中获得的监测数据受各种外部因素的干扰,常产生非线性分类问题,即不存在一个超平面可将2类数据分离或近似分离,需使用非线性分类器进行分类.对于此类问题,核心的求解思路为利用非线性变换使原空间的2类点映射到新空间,使问题在新空间中变为线性分类问题,常采用核技巧来实现.   2.3 一类SVM   一类SVM[12]与前文中所述普通二分类SVM的不同之处在于其只有一类数据,2类数据间的几何间隔便不存在了.一类SVM的基本思路是将数

文档评论(0)

聚文惠 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档