- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
凭借9.5版本,Informatica成为数据集成一站式服务提供商.pdf
凭借9.5 版本,Informatica 成
为数据集成一站式服务提供商
发行日期:2012 年05 月15 日
1998-2012 Info-Tech 研究团队
简介
“最大化大数据的投资回报”是 Informatica 2012 年全球用户会议的主题—此主题听似营销
噱头,但并不是Informatica 为Informatica 公司为展开市场活动而提出的。事实上,“大数
据”强调的是Informatica 新发行的 Informatica 9.5 add 版本。凭借HParser 的发行及其在
Hadoop 中从非结构化到关系数据的转换功能,Informatica 一直处于大数据的潮流浪尖。
全新 Informatica 9.5 继续展现了 Informatica 公司对Hadoop 的承诺,但成为一站式数据
集成服务提供商才是他们更大的战略目标。新版的 Informatica 中具备各种淋漓尽致的数
据集成功能,其中一如既往地不乏突破自我的强大功能。此外,对产品子组件的支持性以
及子组件间的集成也得到改善,并且其核心平台自带更多的高级功能。
数据发现、清洗以及归档
一般情况下,交易数据越大,储存残片也就越多,从而大大增加了数据剖析的难度。
Informatica 9.5 的数据发现功能不但可同时自动发现数据和元数据结构,还能在大量数据
源内一次性明确显示出结构化和非结构化信息中的异常。这使得 9.5 用户更加轻松,尤其
是对于那些集成数据规模大而又没有此类功能的公司而言,之前他们不得不进行人工的、
劳动密集型的数据发现和分析,有了Informatica 9.5,此类公司的数据集成将倍显容易。
发现数据后,即需进行数据清洗。Informatica 9.5 配备工作流和数据管理仪表盘,可简化
支持数据质量和数据治理的工作流程。此外,解决方案中内置有工作流结构,立即可用。
对于尚未实施数据管理工作流程的公司来说,这是一项极为有用的功能。即使是那些因内
置工作流置入工作模型而繁琐累赘的公司,也能从中受益,因为 Informatica 已实现了数
据治理流程的定制化功能。
分区和归档也属于信息生命周期管理不可或缺的一环。虽然该功能通常是在数据库层面上
执行的,但 Informatica 已具备数据归档和智能分区功能,让客户在处理复杂的商业条例
和政策时可实现分区、应用以及数据归档策略的自动化。
安全功能
数据安全仍然是 IT 部门最关心的问题之一。为应对此需求,Informatica 的统一控制台可
帮助用户监视整个企业,从而定义企业的安全政策。该政策是以 Persistent Data Masking
和Dynamic Data Masking 相结合的方式实施的。Dynamic Data Masking 拦截SQL 查询并
根据隐私条例和用户资料将屏蔽的数据返回至最终用户应用程序。该功能实属难得,因为
Informatica 不会对应用程序源代码作出加密、更改,或者更改数据库。还有,由此产生
的执行费用也是最少的。
自然语言处理
Informatica 9.5 版中,Informatica 在使用“自然语言处理”处理非结构化社会数据方面的能
力已得到扩展。它利用概率性数据分析从文本和其他非结构性数据中识别和提取实体和关
键属性,例如名称、企业、地址或者产品。这意味着企业可以提取 Facebook 或者
LinkedIn 中的信息并储存在一个更容易理解和使用的关联表格中(见图 1)。以往,竞争
对手的“自然语言处理”通常只能通过复杂的模块访问,而且并不是全部都紧密集成到基础
平台中,从这方面而言,9.5 是独特非凡的。
图1 自然语言处理结果样例
来源:Informatica
数据时间表
Informatica 9.5 具有数据时间表功能,用于追踪对数据所作出的更改。例如,如果客户更
改了他们的名称和地址,那么数据时间表会保留此客户之前的信息,以备查看和管理所选
时间点上的该信息。通过该时间表,不但可查看所有更改过程而且可靠性极高,例如某操
作的执行时间、执行人以及受影响的数据。
这种用法非常流行,供应商已开始提供支持,例如最近发布的 IBM DB2 10 即具有类似功
能。然而,令人意外的是 Informatica 并不将此作为一个核心功能,因为许多客户对
文档评论(0)