- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Data Mining在信用卡客戶分群之應用蔡欣蕙、陳飛宏、鄭建德、林函穎、 楊宇微謝邦昌輔仁大學統計資訊學系總裁台灣區經理鄭建德行銷主任楊宇微資訊人員陳飛宏專員蔡欣蕙專員林函穎Ben-Ben Bank會議進行中………Data Mining的意義 Data Mining是指找尋隱藏在資料中的訊息,如趨勢(Trend)、特徵(Pattern)及相關性(Relationship)的過程,也就是從大量資料中發掘資訊或知識。Data Mining的功能分類(classification)推估(estimation) 預測(predication) 關聯分組(affinity grouping) 同質分組(clustering)Data Mining的相關技術記憶基礎推理法(Memory-Based easoning)市場購物籃分析(Market Basket Analysis) 決策樹(Decision Trees) 基因演算法(Genetic Algorithm) 群集偵測技術(Cluster Detection) 連結分析(Link Analysis) 線上分析處理(On-Line Analytic Processing ; OLAP)類神經網路(Neural Networks) 區別分析(Discriminant Analysis) 羅吉斯迴歸分析(Logistic Analysis) Data Mining和統計分析比較Data Mining和一般統計分析不同之處在於Data Mining可以處理多個維度的大量資料,避免了下面幾點困難:巨量的紀錄、高維的資料、蒐集到的資料僅有一小部分用來分析。研究工具Data Mining軟體—STATISTICA 6.0基於經費的考量,已取得軟體的使用授權。研究架構及步驟收集相關的文獻探討實際資料挖掘工作(1)集群分析(2)判別分析(3)交叉分析(4)決策樹分析(5)羅吉斯迴歸分析(6)類神經網路分析測試與檢核分析結果研究動機與目的整理及清理資料資料轉檔Data Mining流程圖將原來的資料(2,109,518筆)切割成三大部分:Training Data (1,000,070筆) Testing Data (555,814筆) New Data (553,634筆)Training Data Testing Data隨機抽出0.2%樣本Sample Training Data (2054筆)Sample Testing Data (1125筆) S Training Data S Testing Data 做群集分析產生分群變數依分群變數資料集結果進行判別分析將分群變數與原來的變數產生合併資料集 將合併後的資料集作交叉分析.羅吉斯迴歸.決策樹….將Training Data(1,000,070筆) 及Testing Data(555,814筆)直接做群集分析將Training Data及Testing Data作群集分析產生分群變數資料集將分群變數的資料集作判別分析 將分群變數與原來的變數產生合併資料集將合併後的資料集作交叉分析.羅吉斯回歸.決策樹….Data Mining抽樣流程Data Mining(未經抽樣)流程 Data Mining(未經抽樣+抽樣流程圖)研究結果樣本與母體結構比較分群結果判別結果瑕疵戶預測結果分群特性群集結果分群個數判別結果判別結果誤判率瑕疵戶預測模型結果 Y:是否為瑕疵戶 X:是否逾期超過30天 是否有呆帳紀錄 是否有借款餘額800萬 是否有退票紀錄 是否有拒往紀錄 是否有他行強制停卡紀錄 對不同顧客如何處理黃金單身漢農林漁牧(16.55%)事務職(12.21%)銷售業(11.18%)一年內有申請的意願 (30.3%)信用卡張數2~3張 (55.86%)很少使用信用卡 (18.92%)15~24歲(34.23%)30~34歲(15.08%)未婚(49.76%)上,中上(76.78%)個人月收入20,000元(100%)20,001~40,000元佔(73.59%)平均月開銷20,001~40,000元(15.46%) 家庭月收入60,000元以下(100%)刷卡金額60,001~80,000元(28.02%)銀行殺手大學生(8.18%)專科學生(8.25%)高中職學生(18.99%)逾期30天(10.81%) 呆帳紀錄(9.86%)借款餘額800萬(12.40%) 退票紀錄(10.82%)拒往紀錄(11.10%)強制停卡紀錄(11.77%)經常使用信用卡(34.33%)偶爾使用信用卡(45.98%)個人月收入20,000元以下,其中沒有收入佔(56.87%)平均月開銷20,000元以下(84.69%)家庭月收入60,
您可能关注的文档
- ch1道路工程总论.pptx
- CH2物流网络系统.pptx
- CH4新古典贸易模型的扩展与应用XXXXa.pptx
- CH5_网络营销战略[1].pptx
- ch5固定资产和无形资产.pptx
- ch61完全竞争市场.pptx
- Ch7在产品和产成品成本的核算.pptx
- Ch9公共经济与国民经济调节1.pptx
- CHAP08生产运作管理.pptx
- Chap4工艺选择与设施布置.pptx
- 服务型政府建设中政府与非政府组织互动关系的多维审视与优化路径.docx
- 阳极金属调制对氮化镓基肖特基二极管特性影响的深度剖析.docx
- 新型过氧硫醚介导硫苷活化:寡糖合成的创新路径与应用探索.docx
- 探索炔丙醇类化合物:典型反应机制与多元应用的深度剖析.docx
- 基于MCD饮食模型探究piRNA在小鼠非酒精性脂肪性肝病中的表达及作用机制.docx
- 牛分枝杆菌与卡介苗:对树突状细胞及CD4+T细胞分化的差异化影响与免疫机制探究.docx
- Au电极厚度对MgZnO紫外探测器性能的影响:机制、特性与优化策略.docx
- 制裁阴霾下的航运抉择:伊朗制裁对租船合同合法货物的多维审视.docx
- 科学发展观视域下我国政府环保职能的理论建构与实践创新.docx
- 基于氢氧稳定同位素解析引黄灌区典型农田生态系统水运移机制.docx
最近下载
- 2025年园林公务员测试题及答案.doc VIP
- 华医网不孕症的中西医药诊治新进展相关试题及答案.doc VIP
- CUDA并行编程从入门到实战指南.docx VIP
- 2025超越健康:重构零售药房的社会价值.pdf VIP
- 机械设备施工专项方案.docx VIP
- 张爱玲经典散文(精选11篇).docx VIP
- 1 审计工作底稿编制指引——货币资金.pdf VIP
- 《铁路调度指挥及控制系统》课件——CTC系统概述.pptx VIP
- 高中思想政治必修第1册 中国特色社会主义 第3课 只有中国特色社会主义才能发展中国【复习课件】.ppt VIP
- 信息技术(基础模块)(WPS Office)(AI协同)(微课版)课件 模块七 WPS AI应用.pptx
有哪些信誉好的足球投注网站
文档评论(0)