- 1、本文档共30页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
记忆基础理解
第六章 記憶基礎理解 (Memory-based reasoning, MBR) 如何進行 (學習階段) 如何進行 (預測階段) 解決問題的三個主題 距離函數 組合函數 例 子 例 子 例 子 例 子 例 子 例 子 例 子 例 子 組合函數 其他距離函數 如何獲得最佳結果 MBR的優點 MBR的缺點 * * 定義:用人工智慧的方式,以現有資料庫對新資料進行分類與預測。 記憶基礎理解 (Memory-based reasoning, MBR) 記憶基礎理解記憶基礎理解可以應用的行業: ● 詐欺案件判斷。 ● 顧客反應預測。 ● 醫療服務追蹤。 ● 問卷資料分類。 選擇適當的歷史資料 關鍵:資料的範圍必須能涵蓋原始資料 抽樣方法: 找出具效率的方式代表歷史資料 減少歷史資料庫的記錄數量 (圖9.3、9.4) 設定距離函數、組合函數、和鄰近資料的組數 (K值) 案例研究 – 新聞報導分類 52,751 41,902 70 主題 116,358 47,083 121 地區 2,523 2,242 21 產品 42,058 38,562 9 市場 57,430 38,308 112 工業 4,200 3,926 28 政府 總出現數 文件數 編碼數 類別 案例研究 – 新聞報導分類 選擇測試資料組 : 49,652則新聞稿, 每一則平均2700字與8個編碼 2. 設定距離函數 利用一個叫 “相關回饋(Relevance Feedback)” 的測試標準, 比對任何文件的相似度 (參見課本) ; B與A的距離: d(A, B) = 1 - Score(A, B) / Score(A, A) 案例研究 – 新聞報導分類 3. 設定組合函數 為未分類的新聞找出最相似者 FE, JA, CA 0.607 0.393 4 FE, JA, MI 0.631 0.369 3 FE, JA, CA 0.654 0.346 2 FE, CA, CO 0.924 0.076 1 編碼 權重 距離 相似者 案例研究 – 新聞報導分類 3. 設定組合函數 為未分類的新聞評分 (門檻值為1) 0.631 0 0.631 0 0 MI 1.892 0.607 0.631 0.654 0 JA 2.185 0.607 0.631 0.654 0.924 FE 0.924 0 0 0 0.924 CO 2.185 0.607 0 0.654 0.924 CA 評分 4 3 2 1 編碼 案例研究 – 新聞報導分類 4. 設定鄰近資料組數 1 – 11組 若要配置在單一編碼, 則選擇 較少組數較合適 案例研究 – 新聞報導分類 5. 結果(200則, 半數同意才合格) 案例研究 – 新聞報導分類 2/4 2/4 A,B,C,D A,B,E,F 0/2 0/4 A,B,C,D E,F 4/8 4/4 A,B,C,D A,B,C,D,E,F,G,H 2/2 2/4 A,B,C,D A,B 4/4 4/4 A,B,C,D A,B,C,D 準度 反查 正確編碼 MBR編碼 測量評分的效用:反查(Recall)與準度(Precision) 關鍵特性: 1. 明確界定(Well-defined) : d(A, B) = 0 2. 區辨性(Identity) : d(A, A) = 0 3. 可互換性(Commutability) : d(A, B) = d(B, A) 4. 三角不等式(Triangle Inequality) : d(A, C) = d(A, B)+d(B, C) 絕對值 : |A-B| ; 平方差 : (A-B)^2 ; 標準化絕對值 : |A-B|/(最大差值) 民主方式 (投票方式) 讓最近似的K個鄰近資料以「投票」的方式選出答案。 加權投票 著重在“加權” 最適用問題:類別變數 加權對於結果和信心水準只有小幅度影響,在部份鄰近資料比較近,而部份比較遠的情況下,加權才會有較大的效果。 加入迴歸分析 一次建立一個單變數的距離函數 45,000 45 M 5 55,000 33 F 4 105,000 52 M 3 64,000 51 M 2 19,000 27 F 1 薪水 年齡 性別 紀錄編號 採用標準化絕對值與將三種距離加總 0 .48 .28 .24 .72 45 .48 0 .76 .72 .24 33 .28 .76 0 .04 1 52 .24 .72 .04 0 .96 51 .72 .24 1 .96 0 27 45 33 52 51 27 年齡 同理也可對薪水做距離矩陣 加總 : dsum(A
您可能关注的文档
- 行为主义与二语习得-AI的启发.PPT
- “Handmade in Germany” 德国手工制造世界巡展下一站:天津.PDF
- 行业背景下安全科学与工程学科实践教学平台构建.PDF
- “浸泡式”英文夏令营令营 - Access.PDF
- 行播作物二向性反射(BRDF)的一体化模型.PDF
- 行政院环境保护署废弃物清理专业技术人员训练简章 - 环境工程与科学.PDF
- “太阳日”和.PPT
- 行车操作工试卷.DOC
- 行测速算技巧——数学运算部分 平均数速算技巧——中位数法 在涉及.DOC
- 行星减速机入门、选型和应用 - Thomson Linear.PDF
- 2025年网络文学平台版权运营模式创新与版权保护体系构建.docx
- 数字藏品市场运营策略洞察:2025年市场风险与应对策略分析.docx
- 全球新能源汽车产业政策法规与市场前景白皮书.docx
- 工业互联网平台安全标准制定:安全防护与合规性监管策略.docx
- 剧本杀剧本创作审核标准2025年优化与行业自律.docx
- 2025年新能源电动巡逻车在城市安防中的应用对城市环境的影响分析.docx
- 全渠道零售案例精选:2025年行业创新实践报告.docx
- 2025年网约车司乘纠纷处理机制优化与行业可持续发展报告.docx
- 2025年宠物烘焙食品市场法规政策解读:合规经营与风险规避.docx
- 2025年宠物行业数据安全监管政策影响分析报告.docx
文档评论(0)