分布式高可用架构.pptxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

分布式高可用架构

网站可用性的度量与考核网站的页面能完整呈目前最终顾客面前,需要通过诸多种环节,任何一种环节出了问题,都也许会导致网站页面不可用。DNS会被劫持、CDN服务也许会挂掉、网站服务器也许会宕机、网络互换机也许会失效、硬盘会损坏、网卡会松掉、甚至机房会停电、空调会失灵、程序会有BUG、黑客会袭击、促销会引来大量访问、第三方合作伙伴的服务会不可用。。。。。。要保证一种网站永远完全可用几乎是一件不也许完毕的使命。

业界一般用多少个9来衡量网站的可用性,如QQ的可用性是4个9,即QQ服务99.99%可用,这意味着QQ服务要保证其在所有运行时间中,只有0.01%的时间不可用,也就是一年中大概53分钟不可用。网站年度可用性指标=(1-网站不可用时间/年度总时间)×100%网站不可用时间(故障时间)=故障修复时间点-故障发现(汇报)时间点对可用性的定性描述,两个9是基本可用,年度停机时间不不小于88小时;3个9较高可用,年度停机时间不不小于9小时;4个9是具有自动恢复能力的高可用,年度停机时间不不小于53分钟;5个9是极高可用性,年度停机时间不不小于5分钟。由于可用性影响原因诸多,对于网站整体而言,到达4个9,乃至5个9的可用性,除了过硬的技术、大量的设备资金投入和工程师的责任心,还要有个好运气。

CAP原理在讨论高可用数据服务架构之前,先必须要讨论的一种话题是,为了保证数据的高可用,网站一般会牺牲另一种也很重要的指标:数据一致性。

数据备份数据备份是一种古老而有效的数据保护手段,初期的数据备份手段重要是数据冷备,即定期将数据拷贝到某种存储介质(磁带,光盘。。。)上并物理存档保管,假如系统存储损坏,那么就从冷备的存储设备中恢复数据。

数据热备有可分为两种:同步热备方式和异步热备方式。同步方式是指多份数据拷贝的写入操作同步完毕,即应用程序收到数据服务系统的写成功响应时,多份数据都已经写操作成功;异步方式是指多份数据拷贝的写入操作异步完毕,应用程序收到数据服务系统的写操作成功响应时,只写成功了一份,数据服务系统将会异步的写其他拷贝(这个过程有也许会失败)。

失效转移数据服务器集群中任何一台服务器宕机的时候,那么应用程序针对这台服务器的所有读写操作都需要重新路由到其他服务器,保证数据访问不会失败,这个过程叫做失效转移。失效转移操作由三部分构成:失效确认、访问转移、重新备份恢复数据一致性。

失效确认判断服务器宕机是系统进行失效转移的第一步,系统确认一台服务器与否宕机的手段有两种:心跳检测和应用程序访问失败汇报。

访问转移确认某台数据存储服务器宕机后,就需要将数据读写访问重新路由到其他服务器上。对于完全对等存储的服务器(几台存储服务器存储的数据完全同样,这几台服务器叫对等服务器),当其中一台宕机后,应用程序根据配置直接切换到对等服务器上。假如存储是不对等的,那么就需要重新计算路由,选择存储服务器。

重新备份恢复数据一致性由于某台服务器宕机,因此数据存储的拷贝数目会减少,必须将拷贝的数目恢复系统设定的值,否则,再有服务器宕机,就也许会出现无法访问转移(所有拷贝的服务器都宕机了),数据永久丢失的状况。因此系统需要从健康的服务器拷贝数据,将数据拷贝数目恢复到设定值。

高可用网站的软件质量保证在网站运维实践中,除了网络、服务器等硬件故障导致的系统可用性风险,尚有另一种重要的方面,就是来自软件系统自身。有关老式的软件测试和软件质量保证管理无需赘言,我们这里重点讨论网站为了保证线上系统的可用性而采用的某些与老式软件开发不一样的质量保证手段。

网站公布网站需要保证7×24高可用运行,同步网站又需要不停的公布新功能吸引顾客以保证在剧烈的市场竞争中获得成功。许多大型网站每周都需要公布一到两次,而中小型网站则愈加频繁,某些处在迅速发展期的网站甚至每天公布十几次。不管公布的新功能是修改了一种按钮的布局还是增长一种关键交易功能,都需要在服务器上关闭原有的应用,然后重新布署启动新的应用,整个过程还规定不影响顾客的使用。这相称于是规定给飞行中的飞机换个引擎,既不能让飞机有剧烈的晃动,也不能让飞机降落,更不能让飞机坠毁。既然网站的公布过程实际上和服务器宕机效果相称,那么就可以用服务器宕机的高可用方案来应对网站的公布。因此设计一种网站的高可用架构的时候,需要考虑的服务器宕机概率不是物理上的每年一两次,而是实际上的每周一两次。也许你认为这个应用不重要,重启也非常快,顾客可以忍受每年一到两次的宕机故障,因而不需要复杂的高可用设计。实际上,由于应用的不停公布,顾客需要面对的是每周一到两次的宕机故障。顾客哭了。

自动化测试代码在公布到线上服务器之前需要进行严格的测试。虽然每次公布的新功能都是在原有系统功能上的小幅增长,不过为了保证系统没有引入未预料的BUG,网站测试还是需要对

文档评论(0)

159****1748 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档