ETL工具介绍( Word 可编辑版).docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
a ETL 工具介绍 2021 年 6 月 14 日 目录 引言 3 编写目的 3 文档背景 3 预期读者 3 参考资料 3 ETL 基本概念 4 ETL 的定义 4 ETL 的作用 4 ETL 工具的功能 5 对平台的支持 5 对数据源的支持 5 数据转换功能 6 管理和调度功能 6 集成和开放性 6 对元数据的管理 7 主流的 ETL 工具 7 一类是专业 ETL 厂商的产品 7 另一类是整体数据仓库方案供应商 8 还有一类是由开源提供的软件 8 报表工具简介 8 前端展现 9 建行 RIDE 报表工具介绍 9 RIDE 介绍 9 RIDE 的应用 10 RIDE 功能 10 引言 编写目的 本文介绍 ETL的基本感念和功能, 以及 ETL目前主流工具, 并对 BI/DW架构的最后一个环节报表展示,给予介绍。 文档背景 预期读者 对数据挖掘感兴趣的人员。 参考资料 表名日期 表名 日期 修改内容 备注 ETL 基本概念 ETL 的定义 ETL 分别是 “ Extract、“” Transform 、”“ Load三”个单词的首字母缩写也就是 “抽取 ”、 “转换 ”、“装载 ”,但我们日常往往简称其为数据抽取。 ETL 是 BI/DW (商务智能 /数据仓库) 的核心和灵魂, 按照统一的规则集成并提高数据的价值, 是负责完成数据从数据 源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。 ETL 包含了三方面,首 先是 “抽取 ”:将数据从各种原始的业务系统中读取出来, 这是所有工作的前提。 其次 “转换”:按照预先设计好的规则将抽取得数据进行转换,使本来异构的数据格式能统一起 来。最后 “装载 ”:将转换完的数据按计划增量或全部导入到数据仓库中。 ETL 的作用 ETL 所完成的工作主要包括三方面: 首先, 在数据仓库和业务系统之间搭建起一座桥梁, 确保新的业务数据源源不断地进入数据仓库; 其次,用户的分析和应用也能反映出必威体育精装版的业务动态,虽然 ETL 在数据仓库架构的三部分中技术含量并不算高, 但其涉及到大量的业务逻辑和异构环境, 因此在一般的数据仓库项目中 ETL 部分往往也是牵扯精力最多的; 第三,如果从整体角度来看, ETL 主要作用在于屏蔽了复杂的业务逻辑,从而为 各种基于数据仓库的分析和应用提供了统一的数据接口, 这也是构建数据仓库最重要的意义所在 整个 BI/DW 系统由三大部分组成:数据集成、数据仓库和数据集市、多维数据分析。通常, 商务智能运作所依靠的信息系统是一个由传统系统、不兼容数据源、数据库 与应用所共同构成的复杂数据集合, 各个部分之间不能彼此交流。 从这个层面看: 目前 运行的应用系统是用户花费了很大精力和财力构建的、 不可替代的系统, 特别是系统的数据。而新建的商务智能系统目的就是要通过数据分析来辅助用户决策, 恰恰这些数据的来源、格式不一样,导致了系统实施、数据整合的难度。此时,非常希望有一个全面 的解决方案来解决用户的困境, 解决数据一致性与集成化问题, 使用户能够从已有传统环境与平台中采集数据, 并利用一个单一解决方案对其进行高效的转换。 这个解决方案就是 ETL 。 ETL 是 BI/DW 的核心和灵魂,按照统一的规则集成并提高数据的价值,是负责完 成数据从数据源向目标数据仓库转化的过程, 是实施数据仓库的重要步骤。 如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么 ETL 就是建设大厦的过程。在整个项目中最难部分是用户需求分析和模型设计,而 ETL 规则设计和实施则是工作量最大的,其工作量要占整个项目的 60%-80% ,这是国内外专家从众多实践中得到的普遍共识。 ETL 工具的功能 ETL 工具的功能可以概括为以下几方面:对平台的支持、对数据源的支持、数据 转换功能、管理和调度功能、集成和开放性、对元数据的管理。下面对 ETL 工具的功能分别展开介绍。 对平台 的支持 随着各种应用系统数据量的飞速增长和对业务可靠性的要求不断提高, 数据抽取工具面对的要求往往是将几十上百个 GB 的数据在有限的几个小时内完成抽取转换和装 载,这种挑战势必要求抽取工具对高性能的硬件和主机提供支持。 因此,我们可以从 数据抽取工具支持的平台的来判断其能否胜任你的环境,目前主流的平台包括 SUN Solaris、 HP-UX 、 IBM AIX 、AS/400 、 OS/390、Sco Unix 、 Linux 、 Windows 等。 对数据源的支持 对数据源支持的重要性不言而喻, 因此这个指标必须仔细的考虑。 首先你需要对项目中可能会遇到的各种数据

文档评论(0)

195****3829 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档