mts在分类问题之应用指导教授童超尘教授报告学生庄.ppt

mts在分类问题之应用指导教授童超尘教授报告学生庄.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
mts在分类问题之应用指导教授童超尘教授报告学生庄

DATA CLASSIFICATION USING THE MAHALANOBIS-TAGUCHI SYSTEM MTS在分類問題之應用 指導教授:童超塵 教授 報告學生:莊岳龍 報告主題大綱 ABSTRACT INTRODUCTION THE MAHALANOBIS-TAGUCHI SYSTEM ILLUSTRATION COMPARISON CONCLUSIONS ABSTRACT摘要 MTS是由田口博士所發展出的一種型態辨識 技術,這個技術的主要目的是透過建構一多 變量量表對多維資料進行較佳的預測。本研 究中,利用分析兩組資料來說明MTS的有效 性。執行的結果發現MTS的分類結果較傳統 鑑別分析佳。除此之外,本文亦探討有關應 用MTS之優缺點。 INTRODUCTION前言介紹 由於在技術方面的迅速的發展,組織能容易 收集所需要的數據。更重要的是現代企業能 有效地處理大量的數據並且從資料庫中得到 知識。資料探勘是獲得資料中非常重要技術 之一,而分類是資料探勘的主要任務之一。 有幾種技術是用于分類,例如線性鑑別分析 (linear discriminant Analysis)和數理回歸, 決策樹,神經網路,等等。 INTRODUCTION前言介紹 傳統的統計技術通常需要跟隨一些假定;不過, 同時滿足全部條件是很難的。另一方面,神經網 路方法在以簡單線索條件下有明顯的缺點。MTS 是田口博士所發展的一項新技術,結合了Mahalanobis distance等距觀念、直交表和訊 號雜音比。MTS被推蔫為診斷和預測多維資料的 方法。田口博士認為MTS是數據分析方法並且不 需要假定。 INTRODUCTION前言介紹 MTS的主要目標是透過建構量表,來做多 維系統的準確的預測。當適用於多維資料 時,這項研究的目的是檢查MTS的預測能 力,且有兩套數據用來分析,第一組資料 是植物數據,有著線性架構,第二組資料 是來自台灣銀行的信用卡資料,為非線性 數據。 THE MAHALANOBIS-TAGUCHI SYSTEM MTS是個基於正常觀測值群組的多變量,為了鑑定異常的觀測值的診斷結論和預測的工具。 正常群組的例子為藥品診斷結果中的健康的人,在信貸評估方面有好信用的人,及在產品檢驗過程中良好產品的。 THE MAHALANOBIS-TAGUCHI SYSTEM 使用MTS, 第一步是先定義和抽樣正常觀測值然 後建構一個參考Mahalanobis Space(MS)的量表 ,然後我們確認是否去建造有能力去區分正常群 組和異常群組的Mahalanobis Distance (MD)假如 答案是否定,我們需要重新抽樣或尋找新的數值 來建構MS。假如答案是肯定的,我們能使用直交 表和訊號雜音比來評估每個變數的貢獻和縮減變 數的數量。在相同或者可接受預測水準之下,如 果變數的數量被降低,我們能減少處理資料的費 用。 MTS的重要四步驟 第一階段︰參考MS,建造量表 第二階段:確認量表 第三階段:審查重要的變數 第四階段:診斷或預測將來重要變數的 觀測值 第一階段︰參考MS,建造量表 為了建造一個量表規模,我們需要收集一 組正常的觀測值和使這些觀測值的變數標 準化來計算Mahalanobis Distances(MD)。 下列是用來計算MD的公式︰ 第二階段:確認量表 為了確認量表,在MTS中,決策者再建構MTS量 表變數時,需要檢查及再次核對一下才能被正確 地選擇。當量表確定之後,我們需要使用落在MS 外的觀測值來估計這些變數是否合適。如果異常 的觀測值數量是 t,我們使用平均值和標準差和 正常的觀測值相關母體來計算異常觀測值的MD。 根據MTS理論,異常觀測值的MD比正常觀測值 的MD會來的較大。 第三階段:審查重要的變數 這步的目的是找到重要分析過程或者診斷過程中 有幫助的變數,直交表和訊號雜音比為鑑別重要 變數非常有用的。在實驗過程中,每個因子將會 分派到直交表中的行,每一列代表的是和實驗結 合的執行。我們將在每一步執行,分派變數去計 算MD,然後從MD中獲得訊號雜音比。訊號雜音 比定義為測量量表的正確性的工具。 第四階段:診斷或預測將來重要變數的觀測值 在困苦的現實中,資訊科技讓我們更容易的收集資料。假如我們減少變數的數量,是比較有利的。因此,在這個步驟中我們使用重要的變數,變數是先前步驟中去重新建構的MTS量,並且來證明是否這個量表能恰當地預測及診斷將來觀測值。 圖1中,展示MTS技術如何預測多變量資料。 ILLUSTRATION說明 在這研究中,使用了二種不同的資料,一個為Iris data植物資料,另一個是credit card data信用卡資料。 Iris data

文档评论(0)

ailuojue2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档