- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ETL工具篇--DataStage
谢 谢! * * * * * * 以数据仓库为基础,建立业务模型,以OLAP和数据挖掘技术从中提炼出有用的信息。 */43 ETL工具篇--DataStage 主要内容 什么是DataStage DataStage系统架构 客户端的4个开发工具 几个开发demo Container Job Sequence Job 参数 常用组件简介 两个目标 (1)对DataStage有初步的认识与了解 (2)了解源系统的卸数与ODS的加数过程 什么是DataStage (1)ETL 从数据源抽取数据,并在抽取过程中对源数据进行清洗与 转化,最终加载到目标数据库或数据仓库中去,也就是数据整合的核心内容。 (2)DataStage 是一款为整个ETL过程提供图形化开发环境的数据集成产品。最初是Ascential的产品,后被IBM收购,称为IBM WebSphere DataStage。 (3)当前两个主流ETL工具: IBM DataStage Informatica Power Center DataStage系统架构 C/S架构,通过 DataStage Client 连接到 Server 上进行开发 主要内容 什么是DataStage DataStage系统架构 客户端的4个开发工具 几个开发demo Container Job Sequence Job 参数 常用组件简介 客户端1--DataStage Administrator (1)创建项目 用 DataStage 进行 ETL 的开发之前,需要利用 Administrator 新建一个项目,然后再在这个项目里面进行 ETL Job 的开发。 (2)连接时间管理 (3)许可管理 客户端2--DataStage Designer DataStage Designer是ETL Job开发的核心环境 (1)ETL Job 的开发 (2)ETL Job 的编译 (3)ETL Job 的执行 (1)监测ETL Job的运行状态 记录ETL Job运行的详细的日志文件,以及一些统计数据,如ETL Job每秒所处理的数据量 (2)设置何时运行ETL Job 设置在每天、每周或者每月的某个时间运行ETL Job 客户端3--DataStage Director 客户端4--DataStage Manager 主要用来管理项目资源 (1)ETL Job的在不同项目中的导入导出、以及备份 (2)用于数据表结构、元数据的管理 主要内容 什么是DataStage DataStage系统架构 客户端的4个开发工具 几个开发demo Container Job Sequence Job 参数 常用组件简介 DEMO1--卸数 DEMO2--加数 DEMO3--ODS对代码的标准化 DEMO4--各机构数据的加载 主要内容 什么是DataStage DataStage系统架构 客户端的4个开发工具 几个开发demo Container Job Sequence Job 参数 常用组件简介 Container (1) ETL Job往往都很复杂,为了简化开发布局可以将 一些业务规则封装到一个容器内,称为Container Container分为: (1)Local Container:简化布局、封装业务 (2)Share Container:可以在多个Job内共用 Container (2) C4组件就是一个Share Container,它封装了对源数据的抽取与转化这样一个业务功能 Container (3) 主要内容 什么是DataStage DataStage系统架构 客户端的4个开发工具 几个开发demo Container Job Sequence Job 参数 常用组件简介 为了对ETL Job进行调度、依赖控制、或者日志、出错处理,Job Sequence(序列)采用图形的方式对Jobs进行控制,它同样由Stage与Link组成。 Job Activity Stage的分类 (1)Job Activity:用来指定已经开发定义好的Jobs (2)Routine Activity:用来执行Routines代码 (3)Execute Comand:执行Win、DOS、Unix命令 (4)Notification Stage:用来邮件发送 Job Sequence (1) Job Sequence (2) 主要内容 什么是DataStage DataStage系统架构 客户端的4个开发工具 几个开发demo Container Job Sequence Job 参数 常用组件简介 Job 参数 (1) 为使得JOB
您可能关注的文档
- ANSYS 讲义 应力分析.ppt
- android-位置服务与地图应用.ppt
- ANSYS,LS_DYNA,培训手册 第九章.ppt
- ANSYS,LS_DYNA,培训手册 第十二章.ppt
- ANSYS,LS_DYNA,培训手册 第十章.ppt
- ansys LS-DYNA经典材料.doc
- ANSYS╱LS-DYNA培训第二章.ppt
- ANSYS╱LS-DYNA培训第十二章.ppt
- ANSYS╱LS-DYNA培训第九章.ppt
- ANSYS接触单元学习.doc
- 2025年无人机低空医疗物资投放社会效益报告.docx
- 2025年再生塑料行业包装回收利用产业链重构研究.docx
- 《AI眼镜周边产品市场机遇:2025年终端销售与需求增长洞察》.docx
- 2025年坚果加工行业深加工技术突破与市场拓展策略报告.docx
- 2025年通信芯片行业技术竞争与未来趋势报告.docx
- 《2025年生鲜电商配送冷链事故分析与预防措施》.docx
- 《商业航天融资新趋势2025民营卫星企业资本涌入估值分析市场动态》.docx
- 2025年能源绿色健康行业创新技术与市场应用报告.docx
- 2025年无人机低空医疗救援通信方案分析报告.docx
- 2025年烹饪机器人行业市场集中度分析报告.docx
有哪些信誉好的足球投注网站
文档评论(0)