- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE
4-
一、大数据定义
分析师早起定义的大数据:资料量(Volume)、资料传输速度(Velocity)、资料类型(Variety)。在此基础上衍生出真实性(Veracity)等V系列。
大数据并不是崭新的概念,几十年前科学家就在处理每秒上PB的巨量资料。近几年才出来“大数据”概念,是因为现今要处理的资料量更庞大、资料产生跟处理速度更惊人、资料来源更多样,于是处理、储存大量资料的新技术跟工具快速发展,新技术诞生后,开发者跟使用者需要一个更专业的名词来与之前的科技做出区别,于是‘大数据’诞生了。因此,大数据不只是指资料,也指这些用来分析,处理巨量资料的新兴科技。
过去的资料大部分是人工手工记录下来交易资料,现在则是机器替我们记录下来的交易资料,除此外还有人们跟事物、企业间的互动资料,最终都是通过机器自动生成、累积下来的观察资料。
大数据是由交易、互动、观察资料所组成的资料型态。
大数据定义为:以前因为科技所限而忽略的资料。即暗数据。
也有人认为大数据只是商业智慧和商业分析演化后的新字眼。
大数据是在多样的或者大量的数据中,迅速获取信息的能力。必须在尽可能短的时间内发掘出价值。大数据的核心能力是发现规律和预测未来。
大数据是任何超过了一台计算机处理能力的数据量。
搜集行为数据,进一步挖掘分析,就可以发现大量隐藏在大量细节背后的规律,依据规律,预测未来。
利用大数据技术(搜集和分析数据的技术),能够广泛采集各种各样的数据类型,进行统计分析,从而预测未来。
大数据分析工具(开发预测模型和规范模型),用于分析数据。
大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。
随着业务的不断扩张和历史数据的不断增加,数据量的增长是持续的
数据量大,TB,PB,乃至EB等数据量的数据需要分析处理。
2.要求快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求,所以数据量显得对速度要求有些“大”。
3.数据多样性:不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作,变为结构数据。
大数据:理论,大数据特征、大数据价值、大数据现在和未来、大数据隐私
技术,云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
实践,实践是大数据的最终价值体现。分别有互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面展现的美好景象及即将实现的蓝图。
大数据=海量数据+分析软件+挖掘过程
软件是大数据的驱动力、引擎,软件改变世界。
大数据的特性:数据量巨大、实时性要求高、主要用于预测、更关注价值型。
大数据是如何产生的:移动互联网、社交网络、电子商务等几大拓展了互联网的边界和应用范围。
大数据获取来源:企业内部数据,内部数据是我们所能获取的最成熟、最易于理解的数据,这些数据是通过多年的企业资源规划、主数据管理、商业智能应用和其它吸相关工作收集整理而来,并经过了整合和标准化。利用分析技术解读这些来自客户交易、业务往来、事件和电子邮件的内部数据能够为组织提供有价值的洞察。
用户在线的每一次点击,每一次评论,每一个视频点播,也是大数据的重要来源。互联网企业之所以取得令人瞩目的成绩,其核心的本质就是包括用户网络操作的大数据,进行记录和分析。
大数据在公共服务方面的应用,客观的市政数据,是消除争端,维系公民社会的最佳纽带。
伴随着各国政务的数字化进程,以及政务数据的透明化,公民将能准确了解政府的运作效率,这是不可逆转的历史潮流,同时也是大数据最大的应用领域之一。
大数据特点:数据量巨大,全球在2010年正式进入ZB时代,IDC预计到2020年,全球将总共拥有35ZB的数据量。
多变性:结构化数据、半结构化数据和非结构化数据。如今的数据类型早已不是单一的文本形式,订单、日志、音频,能力提出了更高的要求。
价值型:沙里淘金,价值密度低。以视频为例,一部一小时的视频,在连续不间断监控过程中,可能有用的数据仅仅有一两秒。数据的价值’提纯’是目前亟待解决的难题。
时效性:实时获取需要的信息。大数据区分于传统数据最显著的特征。如今已是ZB时代,在如此海量的数据面前,处理数据的效率就是企业的生命。
大数据是那些超过传统数据库系统处理能力的数据。它的数据规模和传输速度要求很高,或者其结构不适合原本的数据库系统。为了获取最大数据中的价值,我们必须选择另一种方式来处理它。
二、大数据在财政管理工作中的应用
对财政数据进行挖掘分析,既要求熟悉财政管理和国库业务,也要对大数据技术有相当程度的了解。且海量数据的收集、保存、维护、共享及研究等任务,都面临越来越大的挑战。
我们从财政部门已经
文档评论(0)