非结构化大数据智慧分析技术及应用.PDFVIP

非结构化大数据智慧分析技术及应用.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非结构化大数据智慧分析技术及应用

2015第四屆海峽兩岸高校高端IT人才論壇 非結構化大數據智慧分析技術及應用 北京大學 信息工程學院 朱躍生 教授 2015年7月27日 台中 內容提要  大數據基本概念  大數據理論基礎  非結構化數據智慧分析技術  大數據的安全問題 內容提要  大數據基本概念  大數據理論基礎  非結構化數據智慧分析技術  大數據的安全問題 大數據形成(big data)  每天產生巨大數據  互聯網(社交、有哪些信誉好的足球投注网站、電商、微博)、物聯網(感測器,智慧地球)、車聯網、GPS、醫學 影像、安全監控、金融(銀行、股市、保險)、電信(通話、短信)正在瘋狂產生著數據 Email:全球發送約 3 百萬封/秒 Youtube:約3萬個小時視頻/天 推特:發佈 5千萬條消息/每天 亞馬遜:產生 6.3 百萬筆訂單/每天 Facebook: 7千億分鐘/月, 移動互聯網使用者發送和接收的數據高達1.3EB Google :處理24PB 數據/每天 IDC 預測,產生的數據量呈指數級增長,約翻一番/兩年,近兩年產生的數據量相當於之前產生的數據總量。 到2015年,全球數據量約達到7.9 ZB (Zetta-Bytes,1 ZB =270 byte,10 21byte )  已經遠遠超越了目前所能處理的能力!!! 大數據(big data)  定義 度 數據量大到超出目前傳統數據庫軟體工具, 維 在合理時間內達到獲取、管理、處理、並分析 間 空 時空大數據 整理成可決策數據的能力 “Big data refers to data sets whose size is beyond the ability of typical database software tools to capture, store, manage and analyze.” - The McKinsey Global Institute, 2011 時間維度 大數據類型  結構化數據 存在數據庫,可用二維表結構來邏輯表達實現 先有結構、再有數據  非/半結構化資料 字段長度可變,辦公文檔、文本、圖片、XML 、 HTML、各類報表、圖像和音頻/視頻數據等 先有數據,再有結構 隨著網路技術的發展,非結構化數據的數量日趨增大 主要特點-5V  Volume (量大) ZB級,非結構化數據大規模增長, 占總量80%,比結構化數據增長快10-50倍  Velocity (變化快) VERACITY 即時,監控  Variety (種類多) VALUE 文本、圖像、音視頻、機器數據  Veracity (真實性) 完整性、模糊/隱性 》關聯一致性  Value (價值) 挖掘 預測,諮詢,報告 效益 基本屬性- 3I 價值 Inexact 事物的基本特性

文档评论(0)

l215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档