- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库的建库困境二三事
“打怪升级”之 数仓困境二三事Overwrite? 统一的架构? 我们的困境? 最终的方向大数据平台大数据平台理想现实怪兽 之 三足鼎立当时是这样的整合数据抽取Sqoop? 将 Hadoop 和 关系型数据库 中的数据相互转移的工具? 封装到开发工具箱中SqoopSqoop? 现象:抽取不稳定– 每日抽取变化量– 正常5分钟以内– 异常30min以上Sqoop? 原因:数据不均Sqoop? 原因:数据不均[min, max) 数据不均匀select … from tabName where key = min and key max Sqoop? 方案:重新打散,实现Splitterselect … fromwhere (key = or (key = or (key = or (key =tabNamemin0 and key max0)min1 and key max1)min2 and key max2)… and key …)Sqoop? 方案:重新打散,实现Splitter怪兽 之 报表快跑数据及时性? 数据量增长/大促– 重要报表延迟? 原因– 凌晨数据同步占据计算时间数据及时性分而治之 分钟作业数据完整监测小时同步数据及时性? 调度资源管理– 作业组– 并行数– 队列– 优先级怪兽 之 Hadoop危机Hadoop危机? NameNode宕机Hadoop危机? 影响– 所有内部、外部数据产品流量数据– 有哪些信誉好的足球投注网站、广告、推荐Hadoop危机? 方案– 尝试重启系统– 3个月前的镜像– 尝试恢复Hadoop危机? 解决– 尝试修复EditLog怪兽 之 密集恐惧症历史问题剪不断理还乱????需求报表指标混乱数据孤岛僵尸报表如何解决? 我们需要什么 – 指标口径统一 – 知识管理 – 生命周期如何解决? 我们需要什么 – 元数据管理 – 整合BI应用最终的方向
您可能关注的文档
最近下载
- 飞利浦HTS5540 93家庭影院说明书.pdf
- 面馆促销聚人气方案.docx VIP
- 《中国文化概况》带翻译版.pdf VIP
- 人教版数学六年级下册比例(课件).pptx VIP
- 旧版现代西班牙语第1册 课文+答案.pdf VIP
- 2023年贵州贵州高速公路集团有限公司招聘笔试真题.docx VIP
- 变电站运行中倒闸防误操作及对策.doc VIP
- 汽车车身制造技术 项目三 车身焊装工艺.ppt VIP
- Chapter 4 Lending a hand (课件)-2024-2025学年新思维小学英语5A.pptx VIP
- 2025-2030中国会展行业市场发展现状分析及发展趋势与投资前景研究报告.docx
文档评论(0)