Cassandra_概要指南.pptxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Cassandra_概要指南

Cassandra概要指南Agenda基础知识数据模型数据分布策略存储机制数据读写删面向未来NoSql背景 随着互联网大规模的Web2.0应用的兴起,随着云计算需要的大规模分布式服务和分布式存储的发展,传统的关系数据库面临着诸多全新的挑战,特别是在那些超大规模和高并发的SNS类型的应用场景下,使用关系数据库来存储和查询用户动态数据已经显得力不从心,暴露了很多难以克服的问题,例如需要很高的实时插入性能;需要海量的数据存储能力同时还需要非常快的查询检索速度;需要将数据存储无缝扩展到整个群集环境下,并且能够在线扩展等等。在这样的背景下,NoSQL数据库就应运而生了。Nosql支持率调查报告 NOSQL is simply Not Only SQL!NOSQL特点不要叫它们数据库它们可以处理超大量的数据它们运行在便宜的PC服务器集群上它们击碎了性能瓶颈Bootstrap支持CAP一致性(C)指的是当一个写操作完成后,后续的读操作都能够读到更新后的数据。可用性(A)指的是当某些存储节点失效时,客户端发起的读写请求仍然能够获取正确的响应,读写操作仍然有效。分区容忍性(P)指的是存储节点之间的网络连接断开后,存储系统仍然能够进行正常的读写操作,即系统对节点连接断开是能够容忍的。 ACID/BASEBASEBasically Available(基本可用)Soft state(柔性状态) 状态可以有一段时间不同步,异步Eventually consistent(最终一致) 最终数据是一致的就可以了,而不是时时一致ACID原子性(Atomicity). 事务中的所有操作,要么全部成功,要么全部不做.一致性(Consistency) 在事务开始与结束时,数据库处于一致状态.隔离性(Isolation). 事务如同只有这一个操作在被数据库所执行一样.持久性(Durability). 在事务结束时,此操作将不可逆转.(也就是只要事务提交,系统将保证数据不会丢失,即使出现系统Crash,译者补充).Scale Out(向外扩展):就是指企业可以根据需求增加不同的服务器应用,依靠多部服务器协同运算,借负载平衡及容错等功能来提高运算能力及可靠度。 Scale Up(向上扩展):指企业后端大型服务器以增加处理器等运算资源进行升级以获得对应用性能的要求 .Cassandra是一个高可靠的大规模分布式存储系统。高度可伸缩的、一致的、分布式的结构化key-value存储方案。是基于Google Bigtable的数据模型和Dynamo的数据分布思想的开源实现。 Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra 的一个写操作,会被复制到其它节点上去,对Cassandra的读操作,也会被路由到某个节点上面去读取。对于一个Cassandra群集来说,扩展性能是比较简单的事情,只管在群集里面添加节点就可以了。 2007由facebook开发已经在生产环境中使用,比如email index search2009年成为Apache的孵化项目,它是一个网络社交云计算方面理想的数据库 Casandra是什么?而互联网庞大的数据量和极高的峰值访问压力使得以增加内存、CPU等节点性能的垂直伸缩方案(Scale-UP)走入死胡同,使用大量廉价的机器组建水平可扩展集群(Scale Out)成为绝大多数互联网公司的必然选择;廉价的机器失效是正常的,大规模的集群,节点之间的网络临时阻断也是常见的,因此在衡量一致性、可用性和分区容忍性时,往往倾向先满足后两者,再用其他方法满足最终的一致性。在衡量CAP时,bigtable选择了CA,用gfs来弥补P;dynamo选择了AP,C弱化为最终一致性(通过Quorum或者read-your-write机制)。Cassandra 吸取了bigtable和dynamo二者的优良基因。在数据模型上采用了Bigtable的基于列集(ColumnFamily)的模型;在数据的分布式存储上,采用了dynamo的模式,采用一致性哈希将数据散列在节点环上,节点数据的复制采用隐式传送(Hinted Handoff)的方式,节点成员和节点错误探测采用称为Gossip的协议。正是这样,Cassandra获得了高可用、高伸缩(水平扩展)特性,并提供了客户端可控的分级一致性,使得其可应用场景更加丰富。 VersionsThe latest release is 1.1.0-beta1 (released on 2012-2-20)/dyn/closer.cgi?path=/cassandra/1.1.0/apache-cassandra-1.1.0-beta1-bin.tar.gzapache-cas

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档