Day4a_PD思路及方法.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Day4a_PD思路及方法

PD思路及方法 一、服务前准备 1、详细了解故障现象及机器环境 详细准确的故障现象描述是我们正确判断问题的基础。特别是一些比较复杂的问题,我们有时候要升级到更高的Level 进行分析,这个时候必须详细、仔细的描述故障现象。否则二级及三级技术支持很难做出准确的判断。 我们在描述和获取故障现象时必须准确了解以下情况: 是硬故障还是软件故障?即是否为间歇性故障。 出现此次故障是否为新装机。即此机器在当前环境下是否正常使用过? 有什么故障灯亮及各个指示灯的状态。 故障之前所做过的操作。 日志的报警信息。 Check point代码。 客户安装的操作系统及应用。 是否使用非IBM选件及产品 客户情绪及状况。 2、需要准备内容 在做任何服务之前必须有充分的准备,这样才会让客户显示出我们服务的专业性,同时如果有充分的准备,对于我们现场服务工程师来说是有百益而无一害。以下是需要准备的详细内容: 服务器的硬件手册及相关Guide  服务器的当前必威体育精装版微码 服务器相关的Retain tips 收集日志工具 维修时使用工具 二、硬故障常用诊断方法 1、观察法 观察法是我们维修IBM服务器过程中的最常用的方法,我们需要观察机器的详细状况,用来对故障进行判断。 由于IBM提供了详细的硬件诊断灯,对于很大一部份硬件故障,我们是可以通过观察硬件和各个状态进行确定故障所在。 以下我们以3850为例进行详细讲解: 1.1观察前后面板的指示灯 对于IBM服务器,我们首先要做的是观察机器前后面板的指示灯状况。主要需要关注的指示灯有 警告信息灯及错误指示灯 一般情况下警告i灯亮常指日志信息已经存满,需要清理。而对于错误指示灯亮,我们需要参阅LPD中的详解错误指示,如果对于没有LPD的低端机器,需要收集BMC或ISMP或F2日志进行具体判断,如果机器没有BMC/ISMP/F2等功能,我们需要参阅机箱内部的硬件指示灯进行判断。 电源指示灯及PCI指示灯 对于电源,大多数机型都会有AC和DC两个灯,AC是指交流输入,而DC是指直流输出。即当有电通向电源时AC灯会亮,如果电源在向主板供电时DC灯亮。如果AC灯不亮,基本上可以判断为电源输入或电源问题。如果DC灯不亮一般是电源向主板供电的问题。如电源本身,电源背板,或主板等问题。 PCI指示灯中需要关注此PCI的告警灯是否亮黄灯,如果有黄灯亮,说明其PCI设备或此插位有故障。 其它黄色指示灯 有部分服务器,还会有其它故障的指示灯,如3850后面有IO板错误指示等。具体请参阅PDSG指示灯章节。 硬盘指示灯 对于硬盘灯,相对比较复杂,其黄灯和绿灯的不同组合表示有不同的含义,在这里不做详细介绍,具体请参阅阵列卡文档。 一般情况下:如果绿灯长亮或闪属于正常状态。黄灯长亮属于硬盘已经离线,如果黄灯长亮,绿灯闪说明硬盘正在做rebuilding。 对于具体各个指示灯的含义,请参阅PDSG的Introduction章节中的Server controls, connectors, LEDs, and power 的内容。 一般情况下,观察到相应的指示灯后,便可以通过手册查询到其具体含义,这时候可以帮助我们对故障进行一个初期判断,并按照PDSG中的相应故障灯的解决方法进行处理。不过,对于这些指示灯都建议收集一份日志进行再次确认。以保证判断的准确性。 1.2观察LPD指示灯 LPD即Light path diagnostic,用IBM用来方便用户和服务的光通路诊断灯,通过它可以由系统自动判断故障并指示在LPD上,IBM两路及以上服务器都有LPD。 对于LPD中每个选项的具体含义及片理办法,请参阅PDSG的diagnostics 章节中的 light path diagnostics一节的具体内容。 1.3观察机器内部各个部件的指示灯 IBM服务器的板卡上的不同部件都有可报警LED,如果此部件失效,便会以黄灯显示。对于我们不能通过LPD显示的一些系统报警,以及没有LPD的机型,我们可以通过观察机器内部报警指示灯来确认什么部件损坏。 对于各个服务器,在introduction一章的internet LCD一节中,有详细的各个LCD的具体含义介绍,具体请参阅PDSG的相应章节。 1.4观察Check point代码指示灯 Check point是IBM用来诊断自检过程的代码灯,是二位的16进制代码。CP在不同位置,其指示当前自检到不同的步骤。CP代码不仅在主板上有LCD灯显示,如果服务器有显示输出,其在显示器右上角也有相应显示。 如果服务器有故障,我们可以查看故障点的CP代码,通过CP代码手册来查询此代码的具体含义,从而确定故障点。 在PDSG的diagnostics章节中有Check Point的具体下载地址,下面列出部分服务器的代码,供参阅。

文档评论(0)

xyl118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档