计算机安全必威体育官网网址2008-03可靠性.ppt

计算机安全必威体育官网网址2008-03可靠性.ppt

  1. 1、本文档共160页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机安全必威体育官网网址2008-03可靠性

2006-9-1 第三章 计算机系统的可靠性 3.1 什么是计算机系统的可靠性 3.2 容错系统的概念 3.3 硬件冗余 3.4 软件冗余 3.5 磁盘阵列的编码容错方案 3.1 什么是计算机系统的可靠性 可靠性:系统在规定的条件下,完成规定的功能的能力。 可靠性用可用度来度量。 可用度:系统在t时刻处于正常状态的概率。 可用度计算: A(t)=平均无故障时间/ (平均无故障时间+平均修复时间) 平均无故障时间:MTBF 平均修复时间: MTRF 3.1 什么是计算机系统的可靠性 可用性的定量表现: 可靠性的测度方法:抗毁性,生存性,有效性。 可靠性表现为硬件可靠性,软件可靠性,人员可靠性,环境可靠性等。 可维护性:平均修复时间:MTRF 维修保障:后勤支援能力 3.1 什么是计算机系统的可靠性 浴盆曲线 3.1 什么是计算机系统的可靠性 电子元器件的质量等级; 电子元器件的选用: 对元器件性能的掌握; 降额使用; 热设计; 抗辐射设计; 防静电损伤; 防操作过程中的损伤; 储存与保管问题。 3.1 什么是计算机系统的可靠性 热设计技术 热交换途径,热环境影响因素(电能、机械能转换为热量); 冷却方法:自然冷却、强迫风冷、冷板式冷却; “软件冷却” 风道 水冷,液氮冷却 热管,导热 3.1 什么是计算机系统的可靠性 1963年发明并制造出热管,是高效传热元件。80年代前,热管用于卫星等高端系统。 导管内填充了液态导热介质。热管两端产生温差的时候,蒸发端的液体就会迅速气化,将热量带向冷凝端,速度非常快。液体在冷凝端凝结液化以后,通过毛细作用,流回蒸发端。 水--气之间的相变反应,使热管的热传导效率比普通的纯铜高许多倍。 热管传热效果好,噪音低,使用寿命长。 3.1 什么是计算机系统的可靠性 3.1 什么是计算机系统的可靠性 3.1 什么是计算机系统的可靠性 3.1 什么是计算机系统的可靠性 3.1 什么是计算机系统的可靠性 元器件布局 发热元件分散安装 使热敏感元件处于低温区 采用短通路,减少传导热阻 较少接触面热阻 印刷板热设计 机箱热设计 3.1 什么是计算机系统的可靠性 热分析手段 热传导、热对流、热辐射 美 BETAsoft软件,可实现器件级、电路板级、系统级电子产品热分析和热设计。 3.1 什么是计算机系统的可靠性 3.1 什么是计算机系统的可靠性 故障、失效和错误的概念 失效是指硬件物理特性异变。 故障是指硬件或软件的错误状态,是失效在逻辑上的等效。一个故障可以用种类、值、影响范围和发生时间来描述。 错误是指程序或数据结构中的故障表现形式,是故障和失效所造成的后果。 3.1 什么是计算机系统的可靠性 故障的分类 故障可分为逻辑故障和非逻辑故障两种。 按时间划分,故障可分为以下三种: 1.永久故障是指永远持续下去直至修复为止的故障。硬件的永久性故障意味着不可逆的物理变异。软件的永久性故障也是一个不可自动恢复的错误状态。 2.间歇性故障是短暂的、断续,它具有偶然性、不定期的重复性。如一个处于临界状态的电路输出时好时坏,虚焊点也会引起这样的故障。 3.1 什么是计算机系统的可靠性 3.偶然性故障的出现是暂时的,且可能是非重复性的。常因环境的变化、电源干扰、元器件性能的波动、软件的随机变化、电磁干扰等因素而引起。 统计表明,间歇性故障和偶然性故障占整个故障的很大比例,成为系统出错的主要根源。早期美国空军的一项研究报告指出,这类故障占所有故障的80%。IBM公司的一项报告指出:这类故障占所有现场失效的90%。 3.1 什么是计算机系统的可靠性 错误的根源:错误是失效和故障所引起的后果,其根源可以归纳为下图。 3.1 什么是计算机系统的可靠性 容错技术能达到对故障的“容忍”,但并非是“无视” 故障的存在。 它首先能自动地适时地检测并诊断出系统的故障,然后采取对故障的控制或处理的策略。 根据错误的不同情况,一个容错系统可能分10个阶段: (1)故障限制(2)故障检测 (3)故障屏蔽 (4)重试 (5)诊断 (6)重组 (7)恢复 (8)重启动 (9)修复 (10)重构 3.1 什么是计算机系统的可靠性 按照系统的这些失效响应方式,容错技术可分成三种:故障检测、静态冗余、动态冗余。 静态冗余能容忍故障,但不给出故障警告。 动态冗余用于纠错码存储器或具有固定配置(即线路器件之间的逻辑连接保持不变)的多数表决冗余计算机之类的系统中。 3.1 什么是计算机系统的可靠性 3.1 什么是计算机系统的可靠性 提高系统可靠性的方法: 避错:提高软硬件质量,抵御故障。 容错:故障发生时系统仍能继续运行,提供服务与资源。 美国容错计算机有限公司:Stratus 天腾公司Tanden Compute

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档