- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据治理之数据模型管控方案
郑保卫
恩核(北京)创始人兼技术总监
于2013年12月被北京市朝阳区认定为凤凰计划“”海外高层次人才,参与过大量关于数据
架构、数据建模、数据治理、系统性能优化等方面项目,长期致力于数据架构及数据治
理技术方面的研究和实践。荣获2015年中国大数据领域领军人物奖,由国家信息公共服
务平台及国家软件公共公共服务平台颁发。
大家好,今天我主要想和大家分享一些数据治理的经验和数据模型管控的方法。其实数
据治理的难度很大,因为牵扯的东西太多、外围的环境太复杂。尤其是IT系统建设到一
定程度的时候,你才开始做数据治理,难度真的会非常大。数据治理的技术问题不大,
但是想要落地却不是那么简单。我主要讲解2个方面的内容:第一个是数据治理遇到的困
难,通过什么样的方式才能保证数据治理的落地。第二个是数据模型的管控方案。
从去年的后半年开始,我们就可以非常明显的感觉到传统行业都开始做数据治理了。最
近,我去过至少20家左右的银行,他们无一例外都在做数据治理。他们通常的做法是先
找咨询公司做咨询,做完咨询之后开始往下一步走。一般咨询公司都是做两件事。第一
个是设计数据主题域,其实就是业务元数据,把企业的数据分成几个大的主题域,并定
义每个域里面包含哪些数据项。第二个是定义数据标准,主要是定义业务用语,包括它
的内容、英文含义等等。做得深入的一些企业,数据治理成果在数据仓库建设过程中可
能已经落地,但是效果不是太好。还有一些企业可能有自己的数据部门,比如跨区域性
的银行的数据部门可能有十几个人左右、地区性的银行可能只有四五个人。
IT建设从60年代开始,软硬件技术在发生翻天覆地的变化,但是数据方面的技术和应用
却在不断深化,从最早的数据应用、存储到现在的数据分析、管理、统计、整合、挖掘
等。
大家有没有思考过为什么从去年的后半年到今年为止,数据治理会这么火?前两年很多
企业都在做大数据应用,但是传统企业几乎都是很惨烈的失败了,为什么?技术人员说
数据质量太差了,然后领导就会问怎么办?那就做数据治理呗。基于这个原因,今年有
很多企业在尝试做数据治理。
现在,数据治理已经是一个普遍的话题了。前两年我还在给大家宣讲什么是数据治理?
怎么做数据治理?现在不用讲这个事情了,我去很多客户发现他们已经在做了。
大家可以看一下这个趋势,就会发现2-10年间,数据治理方面的技术需求一直处在上升
期,图中标注为红色的部分都是与数据治理有关的技术需求。
数据质量问题是一个历史问题,并不是做了数据治理就能完全解决,只能是在一定程度
上有所缓解,从制度上、工具上、流程上有所保障。
上图是数据治理在国内的发展变化。14年之前,我一直在给大家宣讲什么是数据治理?
什么是数据架构?为什么一定要做数据治理,不做的话会带来什么问题。但是有很多人
觉得这个东西太虚了,离他太远了。有些大企业的IT全部是外包,他们只负责管理,在
买来的半成品或者成品的软件中数据标准是不可能被使用的。有时,我建议一些企业管
理数据模型,他们觉得没必要,同时也没有人力和精力去管理,需要开发的时候就外
包。
早些年这种现象特别普遍,但是随着大家对数据的理解越来越深,尤其是从今年开始,
这种情况逐渐发生变化,大家已经进入到第二个的阶段了。我预测16-18年一定是个高速
的发展阶段,这种项目从咨询开始到落地大概需要一到两年的发展时间,那么到18年,
第一期的效果就会展现出来。所以说经过16-18年的高速发展之后,企业会对数据治理和
落地方式有一个全新的认识,也会找到一种适合自己企业的方案。
18-22年的4、5年时间一定是成熟发展的阶段,数据质量的治理是一个长期的过程,不可
能一朝一夕就解决问题,所以我认为18年以后是一个长期的过程。
数据治理的发展其实也是数据发展的方向,做数据治理和从事数据方面的技术人员不妨
可以朝这个方面去努力,我认为路还很长,未来一定是大有可为的,大家会越做越有经
验、越做越深。
我个人认为可以从三个方面来看数据治理的项目:第一个是目标。企业数据治理的宏观
目标就是为数据应用、项目管理、项目开发提供数据支持,提升数据获取、共享或数据
规划的能力。具体目标是构建数据标准,数据模型、提升数据质量。另外就是要构建一
套适合自己企业实际情况的数据治理体系,这里面包含内容的梳理、数据标准、数据模
型。有些企业将数据标准分成2部分,一个是业务的,另一个是偏技术的。管理流程,要
有相应的人员和相应的流程来保障数据管理的落地,以及数据治理平台的构建,还要构
建一套自动化校验体系。
第二个是项目成功的要素。依照我多年的经验,如果数
最近下载
- 2025年全国预防接种技能竞赛省赛考试题库.docx VIP
- 道路运输合同.docx VIP
- 工学一体化课程《小型网络管理与维护》任务3单元8教学单元活动方案.docx VIP
- 2025年全国预防接种技能竞赛【决赛】考试题库(含答案).docx VIP
- 高清bG晚风吹过哨塔钢琴伴奏正谱.pdf VIP
- 工学一体化课程《小型网络管理与维护》任务4单元2教学单元活动方案.docx VIP
- 全国预防接种技能竞赛理论训练题库及答案(预防接种服务771题).docx VIP
- (正式版)H-Y-T 247-2018 海水淡化产品水水质要求(正式版).docx VIP
- 工学一体化课程《小型网络管理与维护》任务4单元3教学单元活动方案.docx VIP
- JTG公路工程建设项目安全生产费用清单计量规范.pdf
文档评论(0)