HANA产品特点和优势.docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HANA产品特点和优势

HANA产品特点和优势基于内存的高效数据读取和处理在传统的应用系统中,数据被存储在数据库中。当用户通过前端操作界面发出指令后,应用层从数据库中读取数据在应用层进行逻辑运算,并将结果反馈到前端操作界面进行展现或进行下一步的操作。 在这个过程中,从数据库中读取数据因为磁盘I/O的性能限制而成为瓶颈,而这一瓶颈在海量数据的读取中体现的尤为突出,基于海量数据的报表分析就是一个最明显的例子。 存在这一问题的原因是传统数据库实际上是将数据以文件的形式存储在磁盘上并为应用提供访问数据的接口。从数据库中读取数据的本质是从磁盘上读取文件,而在过去几十年的硬件发展中,内存和CPU的性能始终在飞速的提升,只有磁盘I/O的性能提升并不明显。从磁盘上读取数据的速度是毫秒级。而与之相对应的,从内存中读取数据的速度是纳秒级,这基于内存的数据读取比基于磁盘的数据读取性能要快100万倍。所以当基于数据仓库进行报表分析时,如果从传统数据库中读取海量数据需要数十分钟的时间,那么从SAP HANA中读取同样的数据只需要不到一秒钟的时间。在数据爆炸这一大趋势下,HANA 给用户带来了高效迅捷的数据处理和分析能力。行存储和列存储的混合模式 传统关系型数据库是按照行的方式存储数据的,能够为交易系统即OLTP应用提供高效的支持。 SAP HANA 是行业中唯一同时支持行存储和列存储的内存数据库,所以能够对OLTP交易系统和OLAP分析系统同时提供高效的支持。高效的并行处理机制 在近年IT行业硬件的发展中,技术路线发生了明显的变化。以往硬件厂商致力于提供更高主频的处理器,即提升单颗CPU的计算能力,但最近几年,硬件服务器的处理器主频提升并不明显,但是单台服务器配置更多的CPU,并且每个CPU包含更多的内核。这意味着软件系统必须提升并行处理的能力,才能够在新的硬件发展趋势下保证系统的性能能够持续的提升。SAP HANA 的研发过程中和硬件合作伙伴保存了非常紧密的协作,整体的体系架构基于Intel X处理器平台支持多服务器、多处理器的高效并行处理。首先在底层开发中,Intel为SAP提供专门的开发包,让HANA的应用能够最高效、充分的利用多处理器的并发能力。HANA在应用层的架构设计上也能够将数据处理和运算拆分并部署到多个处理器。例如计算引擎可以将数据模型拆解,将一些SQL脚本拆分成可以并行执行的步骤。这些操作将递交给数据库优化器来决定最佳的访问行存储和列存储的方案。 在系统的部署架构层面,SAP HANA可以部署到多台集群的硬件服务器,保证系统的可扩展性以及健壮性。高效的数据压缩优化内存利用SAP HANA的基本机制是将数据全部存储到内存中,以进行高效的数据访问和运算。虽然硬件包括内存的价格日趋低廉,但相比磁盘而言,内存仍是较贵的存储设备。而在企业系统中数据增长迅速,达到数TB甚至数十TB的情况下,将所有数据原封不动的导入内存仍将带来较大的硬件投资。为了帮助企业节省这一部分投资,SAP HANA中采取了基于智能数据字典等高效的数据压缩机制,能够将数据压缩5-20倍,从而充分节约硬件投资。智能数据字典的压缩机制如下图所示。虚拟建模减少数据冗余 在传统的数据仓库中,数据从应用系统及其他数据源抽取并存储在数据仓库中。然而往往不能直接的基于这些原始数据进行分析。需要在数据仓库中建模,即根据不同的分析需求,将所需要的数据进行计算合并,并建立不同的分析维度,从而形成一个特定的数据模型。每个数据模型中的数据都是从物理上单独存储的。一个数据仓库的应用往往建立数十甚至上百个数据模型,这意味着基于同样的原始数据,需要额外硬件存储来保存建立的数据模型。所以我们往往看到1TB的源数据,在数据仓库中变成了2个TB甚至更多。这给用户带来了额外的硬件和维护成本。 在SAP HANA中,将源数据导入内存后,在HANA中的建模有别于传统数据仓库。 HANA中的数据模型都是虚拟的,系统只保存这些数据模型内表的构际关系以及数据的运算逻辑,但不会把数据另外进行存储,只有当前端提交分析请求时,HANA才会根据虚拟数据模型进行数据的计算并将结果提交给前段。这意味着HANA中不会存在冗余的数据,从而大大节约的硬件的投资和维护成本。另外这些虚拟模型可以进行灵活的创建、修改、删除,从而满足业务的需求变化,而无需担心对整体数据仓库数据结构的影响,这比起传统的数据仓库而言能够更加高效的贴合业务的需求。另外,由于HANA没有保存这些数据模型,所以,当源数据系统中的增量数据加载到HANA中时,无需像传统数据仓库中加载增量数据时进行的复杂的数据计算。HANA数据库-保证用户数据的“零”丢失 SAP HANA采用了业界领先的内存计算技术,从而可以保证用户数据的“零”丢失。HANA中的数据都是保存在

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档