- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
5.1认识大数据
我们身处大数据时代
1了解大数据的概念,能判断某些场景是否应用了大数据。3学习目标2理解大数据的特征,明晰传统数据与大数据的区别。知道大数据对日常生活的影响,能有意识地规避个人信息安全隐患。
大数据(bigdata)是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的数据资产。什么是大数据?
(从大数据产生的角度)任务1:阅读案例,与小组成员讨论交流,从案例中归纳出大数据有哪些特征。大数据的特征
案例1互联网时代,我们每天接触的资讯量相当于15世纪的人一生的资讯总量,且全球数据量正以大爆发的速度持续增长,预计到2024年全球数据总量将达143ZB。换算一下,若这143ZB全部是电影,按每部电影1GB计算,全国14亿人每天24小时不停地观看,大约需要50年才能看完。案例2案例3案例5我国的“天网”系统是世界上最大的监控网络,有超过2000万个摄像头。车站、银行、交通路口等要害位置的视频监控24小时不停运转,但所收集到的数据绝大多数是无用的。对公安机关破案来说,几十个小时的监控画面中有用的可能只有几秒。案例4微信上每天约有400亿条信息被发送,每秒信息发送量超过450万条。微信信息类型多种多样,包括数字、文字、图像、声音、视频、文件、地理位置信息、表情、红包、转账信息、聊天记录、名片信息等各种类型。世界上每台汽车都会实时发送信息给制造商,发送频率一般为每15秒至1分钟一条。通过分析报文,汽车制造商能实时掌握汽车信息、了解汽车状况。以丰田汽车为例,2022年丰田全球销量为1050万台,也就是说,仅2022年售出的汽车每分钟就会发回至少1050万条报文。大数据是与人类的网络行为伴随产生的,物联网、云计算、移动互联网、车联网、手机、电脑、导航系统、遍布全球各个角落的各种各样的传感器……,都是大数据的来源或承载方式。世界上每时每刻都有不计其数的数据在源源不断产生,数量巨大到无法完全统计。量大量大、更新快量大、更新快量大、类型多、更新快量大、无用数据多
大数据的“4V”特征:数据体量巨大大量(Volume)数据类型多样多样(Variety)混杂着大量无价值或价值很小的数据低价值密度(Value)数据的更新变化速度快高速(Velocity)
根据信息存储全球领导厂商EMC公司的界定,规模至少在10TB左右的数据集合才能被称为大数据。若你的手机拍出的照片每张约5MB。你每天拍100张照片并保存下来,要存满10TB大约需要多少年?(提示:1TB=1024GB=1024*1024MB)任务2:通过计算感受大数据有多“大”求解过程:所需年数=数据总量/(每张照片的数据量*每天拍的照片数*365天)=10TB/(5MB*100*365)=10*1024*1024*1024MB/(5MB*100*365)≈57.5(年)
分布式并行计算分布式存储大数据的特征(从存储与计算的角度)
案例2:分布式计算工程Folding@home将巨大的计算任务拆解,分配世界各地的志愿者,在志愿者的计算机不忙碌时调用其中央处理器进行计算。目前该工程的计算速度已与世界上最快的超级计算机算力相当,超过了每秒100亿亿次。分布式惊人的算力案例1:2003年,人类第一次破译人体基因密码的时候,辛苦工作了十年才完成了三十亿对碱基对的排序。大约十年之后,采用分布式处理的世界范围内的基因仪15分钟就可以完成同样的工作。
大数据时代的思维方式大数据时代的预言家维克托?迈尔?舍恩伯格全量思维容错思维相关性思维
大数据时代的思维方式全量思维趋向于收集和分析与某事物相关的所有事物,而不是只依靠抽样所得的少量样本数据。大数据时代的思维方式容错思维适当忽略微观层面的精确度,适当追求模糊,只要掌握了大致的发展方向即可。相关性思维不再热衷于寻找因果关系,而注重寻找事物间的相关关系,重要的是探求“是什么”,而不是“为什么”(大数据的互联网思维特征)(“样本渐趋于总体”特征)(“精确让位于模糊”特征)(“相关性重于因果”特征)
《撑阳伞的女人》(法国印象派大师莫奈的名作)容错思维全量思维
案例体现的思维方式用户在社交网络上发送信息并不遵循严格的语法规则,很多语句不完整、有语法错误或拼写错误,但仍然可以被信息接收方理解,也仍然能被信息服务商分析和使用,为其创造价值。美国一家公司将收集到的大量二手汽车数据进行分析,发现橙色汽车有质
您可能关注的文档
- 3.4.1栈 教学设计-高中信息技术粤教版(2019)选择性必修1.docx
- 3.1.2体验计算机解决问题的过程 教学设计-高中信息技术粤教版(2019)必修1.docx
- 3.1.2机器学习算法类型:监督学习 教学设计-高中信息技术粤教版(2019)选择性必修4.docx
- 1.3.3开源硬件项目的开发平台 教学设计-高中信息技术粤教版(2019)选择性必修6.docx
- 1.3.2信息的基本特征 教学设计-高中信息技术粤教版(2019)必修1.docx
- 1.1.2信息社会的特征 教学设计-高中信息技术粤教版(2019)必修2.docx
- 《3.2.2算法的描述》教学设计高中信息技术粤教版(2019)必修1.docx
- 6.1.2部析领域知识智能问答机器人 课件-高中信息技术粤教版(2019)必修1.pptx
- 5.3.1数据的分析 (特征探索)课件-高中信息技术粤教版(2019)必修1.pptx
- 5.2.2二分查找 课件-高中信息技术粤教版(2019)选择性必修1.pptx
文档评论(0)