- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信用卡风险分析
信用卡風險分析 組員:E123502191 張智欽 N954020003 于亨宗 M965040023 鍾友華 Introduction 台灣於民國79年實施金融改革措施,開放新銀行成立。 為促使金融革新,政府逐漸解除各項管制 ,使得保險、其他非銀行業者,相繼投資或跨足經營金融事業。 消費金融商品最活絡的業務中,以「信用卡」的推廣最為成功。 Introduction(續) 在蓬勃發展且競爭激烈的信用卡市場中,各家銀行為了達到其經濟規模,使用各種行銷策略,以擴大市場佔有率。 惡性競爭下,造成一人多卡,個人信用過度膨脹。 金管會督促各發卡銀行注意其資產品質,保障消費者權益及健全市場之發展;種種的因素之下,民國九十三年之後的發卡數量極遽的下降。 Introduction(續) Introduction(續) 發卡業者意識到信用卡業務的成敗,關鍵乃在於一開始便做有效的風險控管,防範違約於未然 。 預先界定出會造成違約的因子,預先排除信用不佳的申請人,以大幅改善信用卡的管理風險,一方面降低違約率,一方面留住好客戶。 發卡前的審核及對新申請者的信用評比。 Determination of data set 基本資料(如:婚姻、年齡、有無子女等)。 個人財務狀況資料(如:有無貸款、信用卡持有數、月收入等)。 客戶所屬風險的狀況。 Data mining procedure Berry和Linoff 建議資料採礦的技術應符 合10項步驟,我們在報告中將依循這時個 步驟,並敘述每個步驟內完整的內容,以 下是我們10個步驟的過程。 Step 1. Translate the business problem into a data mining problem 無法用一般統計模式從某些屬性欄位來評判甚至預測一個客戶的行為,例如會不會使用循環利息、該客戶的風險高不高、會不會違約等等。 透過資料採礦技術(例如:決策樹、類神經網路、貝氏機率分類)和統計方法(例如:羅吉斯回歸),建構出一套完全符合銀行評判客戶特性與其信用卡風險模型之流程。 Step 2. Select appropriate data 資料來源取自銀行信用卡部門的資料庫。 資料檔包括有4117筆信用評等以及個人財務狀況資料,也包含基本資料資訊。 為顧及必威体育官网网址性,這些原始資料皆已先做過相關的整理。 Step 3. Get to know the data Step4. create a model set 我們將所收集而來的4117筆原始資料,將資料以隨機的方式抽成約6:4的筆數,把前者當做訓練資料集來建立模型(有2455筆),而後者當做測試資料集(有1662筆),用此來選擇模型以及測量模型在預測未知資料的能力。此數據是為了避免產生過度學習(Overfitting)的狀況,因為用訓練資料集製作模型時,模型往往會記憶一些不是可以放諸四海皆準的規則,而只是一些發生在訓練資料內部的巧合而被當成規則,因此模型預測的準確性會被假性高估。 Step5. fix problems with the data 透過統計的方式,將4117筆原始資料透過敘述統計來計算每個欄位是否有遺漏、極端值、以及超過某一欄位屬性定義範圍的值,若有缺漏則再採取更進一步的處理方式 Step5. fix problems with the data (續) Step6. transform data to bring information to the surface 這些資料中,並沒有適當的欄位可以予以合併,因此本研究採取尋找資料中與風險有所關聯,以及用矩陣的方式表示出每個欄位兩兩間的相關。若欄位間相關過高,就要考慮是否會有共線性的問題,若太低,則還須觀察該欄位與風險的關聯多寡來決定是否要捨棄某一欄位。 Step6. transform data to bring information to the surface Step7. Build models (Decision Tree) 決策樹以樹狀圖為基礎的方法,決策樹具有規則,規則可以文字來表達,讓人容易瞭解 Step7. Build models (Neural Network) 類神經網路使用大量簡單的相連人工神經元來模仿生物神經網路的能力 Step7. Build models (Logistic) 羅吉斯迴歸,也稱定性變數迴歸,是根據輸入欄位值對記錄進行分類的統計方法。 Step8. Assess models 將1662筆的測試資料集放入原先所建立的決策樹模型 比較原有風險與預測風險之模型的正確率 決策樹模型所預測的風險-training 決策樹模型所
文档评论(0)