资料采矿在交通事故资料分析之应用初探.ppt

资料采矿在交通事故资料分析之应用初探.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
资料采矿在交通事故资料分析之应用初探

永續運輸資訊系統 -交通事故資料分析研究 周家慶 高級分析師 交通部運輸研究所 簡報內容 背景 交通事故資料庫與地理資訊系統 資料採礦(Data Mining) Oracle 之資料採礦模組 Oracle Data Mining (ODM) 試作過程 結論與建議 背景 運輸研究所進行 「交通事故資料庫系統」研究及其分析與設計 評估交通事故分析所需之資料庫來源探討,包括死因資料庫、健保資料庫、保險資料庫、事故資料庫等。 「交通事故地理資訊系統資料庫建置」 進行國省道與臺北市事故資料之實作。 本研究重點在探討各種資料庫之龐大資料量狀況下,如何利用資料採礦架構進行事故資料分析工作。 本架構將為永續運輸資訊系統中之基本資料庫,而永續運輸資訊系統之發展目的乃是希望成為政府從事交通施政成效評估、區域交通建設發展比較與交通成長變化追蹤分析等重要工作之重要工具。 交通事故分析相關資料庫1/3 死因檔 死因資料係記錄我國國民死亡之有關資料,每位當年死亡者的資訊均以一筆記錄儲存於死因檔中,而依據國際疾病傷害與死因分類標準,與道路交通事故直接相關的死因分類為ICD 碼E810至E819之運輸事故。 事故檔 道路交通事故料係A1、A2及A3類道路交通事故案件內容,每一事故案件所記錄之資料可分成事故地點、事件本身、涉案當事人三部份,此三部份之資料分別儲存三個資料表格,彼此間以發生時間-年+序號為串連之鍵,來連結同屬一件事故的人、事、地資料。 交通事故分析相關資料庫2/3 汽車保險資料檔 資料檔包括一般車險及強制汽車責任險兩部份,保險從業人員處理保險事件時,其係依據投保、理賠等處理階段與保險種類之不同,而填具不同的書面資料,包括:一般車險與強制汽車責任險個別之保單資料、批單資料、理賠申請書、理賠計算書、求償計算書,此些資料在資料記錄方式、資料庫結構設計方式上彼此相連結。 門診檔與住院檔 健保資料庫記錄民眾以健康保險方式就醫之各種資料,所用之資料檔為門診處方及治療明細資料檔以及住院醫療費用清單資料檔。 交通事故分析相關資料庫3/3 交通事故地理資訊系統1/3 都市地區事故資料之空間定位 市區交通事故,以地址或交叉路口進行發生地點的描述。 以完整且正確的門牌地址資料庫進,提高事故地點的定位精度,台北市門牌地址的地理資訊資料庫。 交叉路口型事故資料則透過交叉道路之路名與電子地圖之道路名稱比對取得其路口X/Y坐標值,同時亦針對事故位置資料中之地標/地物與電子地圖之地標/地物比對取得其X/Y坐標值,以提高都市地區事故定位精度 。 交通事故地理資訊系統2/3 交通事故地理資訊系統3/3 國省道事故資料之空間定位 依里程數 透過位置參考系統進行 利用動態分段功能分別設定 LRS Datum為交通路網 路網之鍵值為道路名稱與里程起訖欄位名稱 Linear Reference Methods為依里程計算 Event Data為透過ODBC連結之事故點資料 事故資料之鍵值為道路名稱、事故發生里程 都市地區事故資料瀏覽 都市地區事故資料之空間分析1/3 都市地區事故資料之空間分析2/3 都市地區事故資料之空間分析3/3 國省道事故資料瀏覽 國省道事故資料之空間分析1/2 國省道事故資料之空間分析2/2 資料採礦(Data Mining) 資料採礦是一種在大量資料之資料庫中尋找有興趣、有價值的資訊或知識,所以資料採礦可說是結合統計理論、訊息理論與資料庫技術的一種資料分析機制。 進行資料採礦之要件 首先須定義清楚任務 針對每個不同的任務,再來決定須要什麼樣的資料 再從這些資料中找出其所須的特徵,這些特徵是可以區分出不同的類別且具代表性,而它所表現的地方就是要選的屬性 觀察效能,成本效益,是否可以產出更高的利潤 過程都必須是可以被量測的 資料採礦之進行步驟 釐清目標與理解資料 獲取相關技術與知識 整合與查核資料 去除錯誤或不一致及不完整的資料 由資料選取樣本先行試驗 建立模式與型樣 實際資料採礦分析工作 測試與檢核 資料採礦常用模式分類 Classification(分類) 運用已知的結果,結合其相關屬性,來推導出在資料中存在的規則及事實,方法包括類神經網路、決策樹、... 。 Prediction(預測) 運用歷史資料去預測未來變化, 如Regression、 Time-series 、... 。 Association 在找尋資料的關聯性。 找出在某一事件或是資料中會同時出現的東西。 資料採礦常用模式分類 Segmentation 使用區隔(Clustering)方法之類聚的現像,其主要區別在於Clustering並未於事前資料的屬性,而是直接做分群,再做資料分析;不同於Classification的是其已先定義每群資料,對每群資料的特性事前就知

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档