- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
??
?
??
大数据时代的媒体应对
急行还是缓行
?
??
?
?
?
?
?
?
?
???
?
?
?
?
?
杜志刚
媒体在大数据来源上具有优势,随着数据规模的持续增大,如何将数据资源转化为显性价值是媒体经营发展的重要课题。
目前国内为数不多的关于大数据理论研究和分析文章中,对大数据对媒体尤其是中国媒体的冲击形成了一致观点,大多数认为媒体应当面对挑战,进行战略性转型或变革。如上海交通大学新媒体与社会研究中心主任谢耘耕教授认为,大数据时代带来了挑战,媒体不仅需要考虑如何处理海量数据,从中获取有价值的信息,必须同时考虑加强大数据技术研发,以抢占时代发展前沿。也有学者认为,“大数据”对传统媒体的经营管理方式构成巨大冲击。媒体经营管理需要在新闻生产、受众调查、效果研究等方面进行创新,以应对“大数据”的挑战[1]。但也有学者认为新闻媒体在大数据中应当缓行。如新华社新闻研究所新媒体研究中心王武彬就认为,大数据并不一定适合媒体,在“大数据”浪潮中,属于媒体业的想象空间并不多,“大数据”对媒体的价值非常有限,大多数媒体机构在大数据领域并不具备颠覆创新和业务转型的条件[2]。
那么,大数据时代媒体何去何从?首先要明确大数据的内涵和特点,并在此基础上对大数据支持和反对中的疑问进行分析,才可能理解媒体在大数据冲击中该如何应对。
一、大数据的内涵及特点
根据维基百科和MBA智库的界定,所谓大数据(Bigdata),是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。通常,大数据本质上是指大数据(处理)技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。大数据或者大数据时代的特征通常可以用4个V(即Volume、Variety、Value、Velocity)来概括:
第一个特征是数据体量巨大(Volume)。21世纪前,人类全部印刷材料的数据量经过折算,约是200PB(1PB=1024TB),而当前个人计算机硬盘的标配容量就为TB(1TB=1024GB)量级;同时人类历史上全部语言话语的数据量折算约为5EB(1EB=1024PB),而像谷歌、宝洁等大型公司仅公司内部数据量就基本达到EB量级。数据总量的增长速率远超过去。
第二个特征是数据类型多样(Variety)。大数据技术使得巨量的多种类型的非结构化数据,如网络bbs、音视频、多媒体以及物联网等来源的数据,成为可分析、可利用的数据,这使得可处理数据无论是总量上还是类型上,远远超出普通技术可处理的以文本为主的传统结构化数据。
第三个特征是价值开发性大(Value)。虽然大数据因其体量巨大,单位数据价值密度低,如一部一小时的视频内容里有价值的数据可能只有一二秒,但通过合适的机器算法进行“提纯”后的价值总量仍然颇为可观。
第四个特征是处理速度快(Velocity)。大数据通常是实时数据,大多数还需要快速处理,因此,“快数据”是大数据区分传统数据挖掘的最显著特征。
二、反对媒体应用大数据的疑虑分析
疑虑之一:大数据还只是炒作
目前媒体行业对“大数据”的理解存在误读和迷思,很多时候偷换了概念,谈的是“数据”或“大数据时代”,而非“大数据”。同时,很多报道和讨论中所引用的大数据案例,其实也并非真正的大数据案例。
事实上,从政府到大型企业,如美国政府的大数据发展与研究的国家战略计划,Google、Facebook、YouTube、HP等公司,早已开始研发和全球布局,并已开始对外提供大数据分析业务,而前两年的云技术和数据挖掘技术等早已为大数据应用提供技术基础。虽然目前大数据仅仅处于早期阶段,有概念炒作的成分,新概念层出不穷,但是我们非常确定不抓新概念肯定不会成功。
疑虑之二:大数据成本高
首先,大数据技术确实需要较高的成本,不仅对人力成本有极高要求,需要高薪聘请懂得如何使用Hadoop等工具的相关人才,而且实施流程上还要投入昂贵的设备购买费用。但正如OBrien指出,“我并不是说新兴企业就一定不该使用Hadoop,但就我所经历的众多项目来看,小规模公司最好先从MySQL开始——毕竟大部分用户的有价值数据也就在GB级别”。
其次,在大数据领域,Hadoop的低成本和高扩展性是其关键因素。如一个处理PB级规模数据的Hadoop集群(125到250节点)的费用大约为100万美元,而每个节点每年的费用为4000美元。这对于企业级数据仓库的花费(1000万~1亿美元)来说只是一小部分。目前全球最大的科技公司都需要和PB级规模的数据打交道。然而,SAP的研究表明,95%的企业通常只需要使用0.5TB~40TB的数据。如果大家只有10TB甚至更少的数据需要加以分析,那么Postgres或其他一些典型处理系统就完全能够搞定[3]。
最后,大部分数据可能并不花钱或者花钱很少,绝大部
您可能关注的文档
- 大类招生下的计算机科学与技术专业课程体系的改革研究.docx
- 大数据背景下会计转型与智能财务的有效性探究.docx
- 大学生校园信贷影响因素分析与研究假设.docx
- 2024年度必威体育精装版国家开放大学《公司概论》形考作业(含答案) .pdf
- 2024年流动资金借款合同官方版(3篇) .pdf
- 2024年秋季小学教务工作计划(六篇) .pdf
- 2024年教师资格之小学综合素质题库与答案 .pdf
- 2024年建筑工程质量管理协议书样本(带特殊条款) .pdf
- 2024年小学四年级数学(下册)期中试卷(附参考答案) .pdf
- 20年后回到家乡作文(精选15篇).pdf
- 2024年小学教师工作计划模板(八篇) .pdf
- 2024年药学类之药学(师)题库检测试卷B卷附答案 .pdf
- 2024年必威体育精装版仁爱版五年级数学(上册)期中考卷及答案(各版本) .pdf
- 2024年高中生个人职业生涯规划 .pdf
- 2024年法律职业资格之法律职业客观题二题库与答案 .pdf
- 2024年资产评估师之资产评估基础真题练习试卷B卷附答案 .pdf
- 2024年度社工(初级)《社会工作实务(初级)》考试典型题题库及答案.pdf
- 2024年新员工下半年工作计划范文(3篇) .pdf
- 2024年律师委托代理合同标准版本(三篇) .pdf
- 2024年股权抵押借款合同范本(4篇) .pdf
文档评论(0)