GreenplumDatabase_Whitepaper-CN.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GreenplumDatabase_Whitepaper-CN

应对数据驱动型社会的挑战 以数据制胜,以洞察力 在当今的商务环境中,所有重要的组织的运营都离不开数据业务。每个用户的每次点击、来电或者交易,抑或其它商业活动都会产生数据,。企业可以通过这些数据获得洞察力,从而更好地了解其客户、发现问题、提高运营水平、降低风险、或者创造商务价值。 在商务运营中,一些公司一度认为只需采集绝对“重要”的数据就可以了,其它数据可以置之不理。不过,很多现在逐渐意识到:数据的价值其实远远超出他们原来的想象,很难确定哪些数据应该保留,哪些应该舍弃,也就是说很难估量数据对于未来业务的重要性。因此,按照行业分析师Richard Winter的说法企业如果希望有能力实施和普及多种商务战略,就必须详尽无余地存储和分析数据。考虑到数据保留期越来越长(5-7年或更长),也就不难理解为什么数据量会每年增加1.5到2.5倍。 不仅如此,展望未来,很多企业还意识到:为了在将来的商务环境中保持竞争力,他们必须制定新的商务战略,并获取更深入的洞察力,而当前的数据采集工作可能无法满足这些目标。这些企业在五年内扩展数据池达到今天的100倍甚至更大快速的数据存储和分析。除了规模以外,企业借助数据进行商务分析的深度和复杂度也只会有增无减。 Greenplum数据引擎: 推动数据驱动型企业的发展 本白皮书内容 ? 应对数据驱动型社会的挑战 ? Greenplum数据引擎3.2的新增内容 ? Greenplum数据引擎体系 ? 主要的和优势 ? Greenplum简介 2008年9月 第2页 现有基础设施无法跟上发展的脚步 当今的数据仓库解决方案通常是借助通用数据库(比如Oracle)或基于硬件的专用平台(比如Teradata、Netezza)而创建的,而这两种方案都不能从根本上解决当今(以及未来)数据驱动型社会所面临的挑战。 通用数据库(比如Oracle)是针对OLTP处理功能设计的,在运行大量小规模交易查询数据时效果最好。从结构上来说,他们采用了“完全共享”或“磁盘共享”体系(图1)。“完全共享”体系局限于单一服务器(通常是价格比较昂贵的SMP服务器),其扩展性和性能受到相应的限制。“磁盘共享”体系(比如Oracle RAC)允许系统带有多个服务器,这些服务器与SAN或其它共享存储设备相连。这种体系需要通过一个狭窄的数据管道将所有I/O信息过滤到昂贵的共享磁盘子系统。(请注意在“完全不共享”体系中,对每个使用直接相连磁盘的节点来说,其I/O带宽都近似等于通往共享磁盘子系统的数据管道)。实践证明:这些通用磁盘共享体系复杂、脆弱,在处理万亿字节数据时难以胜任。 图1 – 数据库体系类型 与此相比,基于硬件的数据仓库平台(比如Teradata、Netezza)采用与Greenplum同样类型的“完全不共享”体系。在这种体系下,在主机上规划查询项目,并将其分成若干部分在集群上并行执行,所有通讯功能都在一个高宽带网络互连体系上实现。这种体系的一个重要优势就是每个节点都有一个通往本地磁盘的独立高速通道,从而简化了体系,并提供扩展性很好的并行扫描和查询处理功能。 注:在所有图示中的共享资源都用灰色突出显示。 第3页 这些平台所面临的困难是它们需要价格昂贵的专用硬件,从而显著增加了采购和总体拥有成本。客户在使用操作硬件和新式商用硬件技术时没有选择的余地 – 他们必须等待供应商新技术。 需要采用新的方法 以往的经验已经多次证明:专有硬件的优越性只能维持很短的一段时间,然后就必然被迅速更新的商用硬件取而代之。在数据仓库领域,专有互连体系、定制处理器/FPGA以及其它类似组件都曾经占有一席之地。不过,从现在的情况来看,这些老式技术已经逐渐被一级供应商(比如AMD、Intel、Sun、HP、Dell和IBM)所提供的新式商用硬件所取代。 Greenplum的战略重点是成为新一代数据仓库和大规模分析处理数据库软件的重要供应商。公司根据“一切商用”的原则为客户提供新式、分散、经济的大规模分析模型 – Greenplum采用了基于相关标准的方法,可以帮助客户创建数据仓库,充分利用低成本的商用服务器、存储和联网,通过经济的方式升级到千万亿字节的系统。 从系统性能的角度来看,根据摩尔定律,每个CPU所集成的处理内核越来越多。与此同时,数据量的增长速度超过了摩尔定律。因此,为了与数据扩展保持同步,各个公司需要合理增加系统节点,从而不断扩展系统的容量和性能。借助Greenplum,很容易实现这种扩展,在不断增长上充分利用内核的并行操作能力。Greenplum具有海量数据并行操作的“完全不共享”体系,该体系充分利用每个内核的能力,具有线性扩展能力和无与伦比的处理性能。 Greenplum数据引擎:全球功能最强大的分析数据库 Greenplum数据引擎是一种

文档评论(0)

zhanci3731 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档