1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模糊推论

* 資料探勘與資料形式的關係 資料探勘技術 多層次資 料一般化 分類法 群集分析 關連法 則探勘 時間序 列分析 以樣式為基礎 的相似搜尋 關聯形式 交易形式 時間形式 本文形式 * 資料型式的轉換 以購物網站所用的資料庫為例 記錄顧客所買的每樣商品資料,包括:交易編號、會員帳號、商品編號、交易時間、交易數量、付款方式 若分析顧客同一天購買的商品間關連性,目前交易表內所存的資料 格式並無法直接套用關連法則探勘演算法,要經以下步驟轉化 Step 1 - 選取相關屬性:選出會員帳號、商品編號、交易時間三個屬性。 Step 2 - 精簡資料:將精確至年月日時分秒的交易時間簡化為只包含年月日的交易日期。 Step 3- 轉換資料形式:依照會員帳號及交易日期將同一會員同一天的交易紀錄集合成一筆交易形式的資料。 * 第三章 資料前置處理 簡介 資料前置處理的主要工作 遺缺填補法 雜訊去除法 資料正規化 資料形式轉換* 資料型態轉換* 資料模糊化** 總結 * 資料探勘中的資料型態 離散型 (discrete) 預先定義的資料集合所組成 集合中兩個值的距離無法直接計算 像布林型態(例如:性別)、列舉型態(例如:職業等)、或是字串型態(例如:地址)均屬於此類型 連續型 (continuous) 數字型態(例如:平均月收入) 或是日期型態(例如:生日)均屬於此類型 * 資料探勘技術適用之資料型態(1) 離散型 監督式學習法 ( supervised learning ) 分類法 連續型 監督式學習法 非監督式學習法( unsupervised learning ) 群集分析法 * 資料探勘技術適用之資料型態(2) 特性型態 資料型態範例 兩值間的距離 分類探勘 群集分析 理解度 離散型 布林型態 列舉型態 字串型態 較難計算 適合 不適合 較高 連續型 數字型態 日期型態 較易計算 適合 適合 較低 * 資料型態的轉換 離散型轉換成連續型資料 Step1:用相似性矩陣定義值與值的距離或相似度 Step2:再利用值與值的距離或是相似度把離散的 資料形態表示成連續的資料型態 連續型轉換成離散型資料 Step1:利用群集分析法將數值型態資料分群 Step2:接著將群集做合適名稱,再利用群集的名稱 代替群集內所包含的數值型資料轉換成離 散型資料 * 第三章 資料前置處理 簡介 資料前置處理的主要工作 遺缺填補法 雜訊去除法 資料正規化 資料形式轉換* 資料型態轉換* 資料模糊化** 總結 * 資料模糊化 在二進位邏輯中只有兩個可能的值(「成立」或「不成立」) 現實生活中的許多概念的表達,並非只有成立或是不成立這樣極端的值所能描述 不適合用來處理不確定性 (uncertainty) 1965年Zadeh提出模糊集合 (fuzzy sets) 與 模糊邏輯 (fuzzy logic) 的概念 描述真實世界中許多不明確、含糊不清的事物 * 模糊集合與模糊邏輯 模糊集合 (fuzzy sets) 傳統集合:只有「是」與「否」兩種情況 模糊集合:每個元素均有特定的歸屬程度 例如:160cm(0.0) 170cm(0.5) 175cm(0.75) 180cm(1.0) 模糊邏輯(fuzzy logic) 利用「模糊定量詞」(fuzzy quantifiers) 來表達 「大多數的」、「相當多」、「不很多」 「模糊命題」(fuzzy propositions) 「湯姆很年輕」或是「明天可能下雨」 * 模糊資料探勘 包括四個主要的處理程序: 「模糊化」(fuzzification) 「模糊資料探勘」 (Fuzzy Data Mining) 「模糊推論」(fuzzy inference) 「解模糊化」(defuzzification)。 * 模糊化 主要是將所有語言變數的實際輸入值(如年齡、 年收入)透過語言值 (linguistic value)的模糊成員函數 (membership function)求得模糊輸入值 (fuzzy input)後,接著進行資料探勘 找出大量資料當中的模糊規則,進行模糊推論, 得出模糊輸出值,最後再經由解模糊化將推論完 成所獲得的最終結果值轉換為另一個語言變數的語言值 * 模糊化範例 範例 定義年齡成員函數,輸入數值 “約翰是67歲”, 取67歲平行於縱軸,分別與年輕和年老 函數曲線相交 約翰年輕的程度為0.46 ,約翰年老的程度為0.92 年老 年青 1.0 0.92 0.46

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档