天津交行无代理IT监控方案设计与研究.docx

天津交行无代理IT监控方案设计与研究.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

天津交行无代理IT监控方案设计与研究

?

?

王绍红

摘要:“531工程”项目上线后天津交行基于新的IT架构设计了一套无需部署代理端的IT监控方案,即通过Linux网络命令直接对主机服务和网络节点进行逐一扫描,以扫描结果作为监控指标,通过指标间的关系来定位故障点,丰富了生产系统监控手段,提高了故障发现和排除的效率。

关键词:IT运维;无代理监控;指标;故障定位;CMDB

:TP308文献标志码:A:2095-2945(2018)28-0096-03

Abstract:Afterthe531Projectwaslaunched,BankofCommunicationsTianjinBranchdesignedasetofITmonitoringschemebasedonthenewITarchitecturewithouttheneedtodeploytheagent,thatis,directlyscanningthehostserviceandnetworknodesonebyonethroughtheLinuxnetworkcommand.Thescanningresultisusedasthemonitoringindextolocatethefaultpointthroughtherelationshipbetweentheindicators,whichenrichesthemonitoringmeansoftheproductionsystemandimprovestheefficiencyoffaultdetectionandremoval.

Keywords:IToperationandmaintenance;agentlessmonitoring;index;faultlocation;CMDB

1概述

隨着交通银行“境内外一体化全业务系统重构工程”(即531工程)项目2015年7月在天津成功上线,交通银行天津市分行(下面简称天津交行)在以新型技术架构助推银行转型发展的道路上迈出了一大步。这项浩大的工程,以业务整合为突破口,打破横向条块分割的约束,立足当下,着眼未来,以强大前台、高效中台、集约后台合力打造一流的流程银行。新架构在为业务发展提供支撑和推力同时,也为开创IT运维工作新局面提供了契机。天津交行作为交通银行的省级分行,在工程上线期间即考虑未来的分行IT监控问题,基于对新架构下主要系统的技术平台高度统一的认知,逐渐形成了一套对生产运行几乎无影响的无代理监控方案。传统的监控,一般是在各目标主机部署代理端抓取系统运行信息发送给监控服务器,由其加工后生成图表、发出异常警告。由于代理端自身对系统资源是有消耗的,其开发、部署、维护需要一定的人力成本和时间成本。同时重要的网络节点也需要监控,而代理端程序很难在网络设备上安装,因而传统模式存在某种局限性,需要新的监控手段作为补充。新的方案放弃了传统的代理端部署,改为通过Linux网络命令直接对主机服务和网络节点进行逐一扫描,以扫描结果作为监控指标,通过指标间的关系来定位故障点,丰富了生产系统监控手段,提高了故障发现和排除的效率。此方案一经初步实施,即收到良好效果。据此设立的无代理监控平台(下称监控平台)一期脚本仅几千字节,以集中的网络扫描代替分散的代理端数据采集,实现了对生产系统大部分重要节点的监控。目前监控平台还在根据预先设计的方案持续建设中。本文谨从介绍平台当前架构和技术出发,延伸到下一步以指标及指标依赖、指标集合为核心的智能化监控目标,对未来可能使用到的其他技术做出初步的研究。

2监控平台现状和核心技术

传统监控模式下的信息流向是从各代理端到服务端,代理端处于主动地位。在天津交行的无代理监控平台中没有代理端、服务端的区分,监控的发起始于平台主机,目标则是IT系统的各个主机、网络上的各个重要节点。常规情况下,监控平台根据预先定义的扫描策略在指定时间对目标主机、网络节点进行网络扫描,同步记录扫描结果,生成可通过Web浏览器访问的报告,发现有某项结果异常,根据策略中设定的信息发出警报。网络扫描结果的有效性基于IT系统得以正常运行的三点基本要求:(1)各主机、网络节点在网络上处于连通状态。(2)主机的对外服务端口处于监听状态。(3)主机对外服务对请求应该有合理的响应。

监控平台运行在Linux操作系统上,其原生的三个网络命令ping、netcat、curl可以分别按上述三点要求对IT系统(含网络设备)进行扫描。ping命令很常用,可检测某个ip在网络上

文档评论(0)

183****9774 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档