云计算CAP理论.docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
云计算CAP理论

CAP定理分布式领域CAP理论1.1 CAP理论的提出在分布式计算系统领域中,有CAP定理(CAP theorem),又被称作布鲁尔定理(Brewer’s theorem),它指出对于一个分布式计算系统来说,不可能同时满足以下三点:一致性(Consistency):所有节点在同一时间具有相同的数据。可用性(Availability):保证每个请求不管成功或者失败都有响应。分隔容忍性(Partition tolerance):系统中任意信息的丢失或失败不会影响系统的继续运作。这3个核心的需求是:Consistency,Availability和Partition Tolerance,赋予了该理论另外一个名字- CAP。此理论首先是在2000年的分布式计算原则研讨会的开题演讲中由计算机科学家Eric Brewer(University of California,Berkeley)提出猜想。Brewer认为在分布式的环境下设计和部署系统时,一致性,可用性与分割容忍性这三个核心需求是以一种特殊的关系存在。在当前应用系统越来越web的情况下,要获得高可用性,确保数据一致性是无法做到的。直到2002年,麻省理工学院的Seth Gilbert和Nancy Lynch对此猜想做出了理论上的证明,从而成为CAP理论。2.理论的证明2.1 CAP定理的举例说明首先,为了能更直观的了解CAP定理,我们举一个简单的例子。在某个节日里,某用户有哪些信誉好的足球投注网站到一件喜欢的衣服,但是用户并没有立即购买,他选择先浏览其他的网页。与此同时,另一用户也看上了这件衣服并将其放进购物车。那么第一个用户在返回页面决定购买该商品时,他是否能将该商品添加进购物车呢?由于一件商品只能由一个用户购买,理论上,第一个用户是不能添加该商品进购物车的。假设网站的数据是以分布式系统的方式存储在多个地方,那么,一个数据存储在不同地方,就必然存在数据的同步和一致性问题。如果用户在购买商品时,系统访问的数据库没有得到及时的更新(在该数据库中,该商品的库存本应该是零),那么第一用户就可能将该商品添加进购物车。这里所讲的就是分布式系统中的数据一致性问题。在这个例子中,如何解决数据一致性的问题?一个简易的方案就是建立类似操作系统中死锁的机制,要求确保所有数据节点的数据均同步之后,才能进行数据的访问操作,也就是在数据同步后才能决定用户能否添加商品。但这引入了一个新问题,就是可用性问题。由于不同数据节点间的数据同步是需要时间的,这使得网站可能在业务最繁忙的时候瘫痪。这时保持数据的一致性就需要漫长的等待了。一个他人无法访问的服务对任何人都没有价值。这就是分布式系统中的可用性问题。另一个想法就是每一份数据只保存一份,不做备份,这样就不会存在数据一致性的问题。而因为网站的数据量太大,一个数据节点无法容纳如此大容量的数据,所以把整体数据分割成若干部分,每一部分存储在不同节点上。这样就能解决可用性的问题。但这样也会有个很明显的问题,假如某一时刻两个数据节点间的网络阻塞或者切断了,那么这两个节点间的通讯就失去了,从而导致网站可能不能得到完整的数据。这就是分区容忍性的问题。所以,三个核心需求之间无法同时得到完全的保证。2.2 CAP定理的详细解释下面是CAP定理三个核心需求的详细说明。2.2.1 一致性在分布式系统中,数据通常不只有一份。一致性指在一个系统中不论数据存放在何处, 作为一个整体他们应是完整和一致的。用户对数据进行一定的修改操作(增/删/改)之后,为了保证数据的一致性,那么应该对所有数据进行相同的操作并且这些操作应该是同时成功或者同时失败的。如果一个存储系统可以保证一致性,那么则客户读写的数据完全可以保证是必威体育精装版的。不会发生两个不同的客户端在不同的存储节点中读取到不同副本的情况。具体来说,系统中对一个数据的读和写虽然包含多个子步骤并且会持续一段时间才能执行完,但是在调用者看来,读操作和写操作都必须是单个的即时完成的操作,不存在重叠。对一个写操作,如果系统返回了成功,那么之后到达的读请求都必须读到这个新的数据;如果系统返回失败,那么所有的读,无论是之后发起的,还是和写同时发起的,都不能读到这个数据。2.2.1 可用性可用性简单的来讲就是用户在访问数据时可以得到及时的响应。可用性是关于一个系统能够持续不间断使用的问题。严格定义上的高性能可用性意味着一个系统从设计到实施都应该能够提供可持续的操作(如读写操作),无论是操作冲突,还是软硬件部分因为升级而导致失效。但是可用性并不意味着数据的一致性,通常在缺失必威体育精装版一条记录,但对于用户仍有返回数据的情况下,仍然可以被认为是可用的。同时可用性的内容中应该包含时效性,对于大多数应用而言,超过一定响应时间的服务是没有价值的或者价值量低的。例如,Amazon和Google这样的公司很细

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档