大数据公共服务行业应用案例v1 .pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

JIMODB公共服务行业应用案例

案例概述

1.客户系统存在的问题和需求

原有的系统由IBM小型机、DB2大型数据库和EMC磁盘阵列组成的顶级配置,但是能处理的数据量依然非常有限,

系统的容量到了极限。且原有系统不具备数据分析功能,硬件设备不具备扩展能力,每次系统的更新换代都需要停

机进行数据迁移,迁移成本很高。

现有系统不仅性能如此低下,而且包括硬件、软件开发费用、软件实施费用等所有费用,系统总价为3000万,其

中硬件成本就达到1200万。如果按其只支持6个月数据来计算的话,每天数据的系统总成本为166,667,每天数

据的硬件成本将高达66666。

通过与供气公司的沟通,根据其现有的业务运营系统以及多年以来商业智能(BI)方面的经验总结,公共服务行业

当前主要的需求分为数据存储类需求、数据安全类需求、系统扩展性需求、数据查询类需求、统计类需求、数据分

析类需求以及统计分析结果的展示方式需求。

2.JimoDB解决方案

JimoDB是晟淘大数据独立研发、拥有完全独立自主知识产权的新型NoSQL实时智能大数据平台和大数据完整解

决方案。JimoDB在普通硬件上实现了高度分布和线性扩展,其即可以在一台设备上运行,也可以在上千台设备构

成的集群上运行,实现PB级海量处理能力。通过JimoDB为客户架构大数据平台,以普通的x86pcserver代替

价格高昂的高性能服务器实现客户3-5年的话单及流量明细数据的存储,并通过JimoDB的快速分析平台,为客户

实现快速的数据分析功能,使客户原来小时级的查询可以在秒级实现。

本方案充分利用了JimoDB的高性能数据存储、非结构数据处理、无共享点技术、快速查询与快速统计等功能,使

得研判分析的深度、数据量及响应速度都在同类方案中领先,同时通过云立方实现的完全无共享点技术使得整个系

统的硬件投入降低90%。因此,同样的投入情况下,本方案能够提供更多维度更高效的舆情分析能力。

1)高性能大数据存储引擎(JDFS)

高性能大数据存储是所有大数据系统的基石。Hadoop的HDFS虽很大程度解决了大数据存储,但HDFS存在着诸

多问题,导致应用开发极为困难。JDFS是晟淘大数据独立研发的一款高性能大数据虚拟文件系统,专注高性能大

数据存储核心技术,解决了HDFS诸多问题:

多级缓存

高性能索引引擎

高性能排序引擎

高性能小块数据(Docs)引擎

克服了HDFS只写不修改和不支持随机读取限制,支持高性能随机读取、写入和动态更新

通过DataConnector可以非常容易地集成外部数据,包括Hadoop、关系型数据库数据、HBase等

2)云立方体系结构

云立方剥离运行环境与物理设备的依赖,通过虚拟技术,建立大数据抽象层。云立方“垂直分割”大数据系统,拥

有完整的计算能力;每个云立方相互独立,在统一抽象数据层上组成云立方集群,构成强大的高并发计算矩阵。云

1

立方相互多份备份,发生故障时实时切换。数据路由技术“算出”哪个数据保存在哪个云立方上、备份在哪些云立

方上,系统任何单点故障源,无系统瓶颈口。当系统硬件发生变化时,云立方检测其变化而做相应调整,实现动态

实时扩容。

3)可视化大数据应用开发平台

众所周知软件开发难,而大数据应用开发则是难上加难。传统的手工编程需要靠员工的丰富的编程经验以及不停的

Debug来使软件变得稳定可靠。然而大数据系统由于数据量如此之大,以至于很多的任务本身就要几个小时乃至

几天才能得到结果,由人手工编程此时的风险则显得风险更加不控制。可视化编程技术极大地简化应用开发的难度,

让业务人员可以直接业务数据的分析与应用开发,摆脱对编程人员和开发商的依赖。

可视化不编程技术无需手工编程,是实现极速应用开发的关键性技术,让我们可以对市场和公司经营出现的新需求

做出快速反应,捕捉商机。而Hadoop系统必须手工编程,开发周期长且对开发商的依赖程度大。

4)5.4快速查询与快速统计

数据仓库本来为快速统计而生,但陈旧技

文档评论(0)

192****1067 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档