决策树技术在物流金融信用风险中的应用.pdfVIP

决策树技术在物流金融信用风险中的应用.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策树技术在物流金融信用风险中的应用.pdf

决策树技术在物流金融信用风险中的应用 认识。随后又出现了物流银行、仓单质押、融通仓、金融物流等概念。 储雪俭等提出目前我国金融物流信贷风险防范中的四个主要难点,并给予了相关的对策建议。孙颖对物流金融的业务风 险、宏观环境风险和法律风险进行了分析,提出了相关的风险管理建议。王元元认为物流金融业务中进行融资的中小企业是银 行最主要的信用风险来源,其次,物流企业也是银行面临的信用风险来源。 随着定性研究的逐步深入 ,定量研究开始出现。潘永明从物流金融运营状况、第三方物流企业综合实力、中小企业综合实 力和行业状况四个方面对物流金融信用风险的影响因素进行分析,建立了物流金融信用风险评价指标体系。刘哲等利用模糊层 次综合法从企业基本特征、财务能力、货物风险、履约能力、发展潜力等五个方面构建物流金融信用评价指标体系,并对这些 指标因素进行细分 ,建立了三级四层的指标评价体系。何明珂运用 BP神经网络评估模型以及Maflab软件将某一项具体的物流 金融业区分为高、中、低三种风险。 综上所述 ,国内对物流金融的研究多集中在物流金融基本知识、风险种类及防范和信用评价指标体系建立等方面。 2 决策树技术 数据挖掘 (DataMining,DM)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们 事先不知道的、但又是潜在的有用信息和知识的过程。数据挖掘又称数据库知识发现。决策树是数据挖掘诸多技术和方法中常 见的一种 ,它的优势在于通过对 已知类别训练集的分析,可以提取出有价值的分类规则,从而对新数据的类别进行预测 ,给决 策者提供一定的参考。 ID3算法是基于决策树的挖掘算法 ,以信息增益作为属性测试,并选取具有最高增益的属性值作为分裂属性,自顶向下地 构建决策树,直到不能再划分为止。ID3算法的核心问题是如何选取决策树的每个节点要测试的属性。 设 是s个样本数据的集合 ,将样本划分为m个不同类 (1,…,m)的信息熵按式 (1)计算 (其中P.是任意样本属于 的概率): 。,s)一∑PlogP (1) 假设属性A作为决策树的根节点,属性A具有 个不同取值,把数据集s划分成 个子集fS,.s:,…,},根据属性A划分 成的子集熵按式 (2)计算: )-一∑斟 ×) (2) 信息增益为原来的信息需求 (基于类 比例)与新的信息需求 (对A划分之后得到的)之间的差,即式 (3): Gain(A)=J(s1,.s2,…,s)一E(A) (3) 3 算例研究 决策树技术应用于物流金融信用风险中的基本思路是:根据已知样本和原始信用评价状态,发现贷款企业信用状态与其某 些特征属性之间的关系,进而通过对这些企业属性的具体观察值,对其信用状况进行预测。本文利用ID3算法给出某物流企业 的具有高还款风险客户的特征属性,为银行等金融机构进行风险控制提供参考依据。 3.1数据选择和预处理。假设从某物流企业的数据库中收集到的客户信息有注册方式、信用等级、企业规模、企业性质等。 需要注意的是进行相关分析的数据不是只存储在一个数据库中,还可能存在于其它数据集中,要根据实际需要进行相关的收集 整理。收集后的数据往往不能直接挖掘,需要进行一定的选择、清理、转换和归纳等预处理工作,数据预处理工作准备是否充 分 ,对于挖掘算法的效率乃至正确性都有关键性的影响。 ID3算法比较适合处理离散数值的属性 ,表 1中的注册资本和销售业绩是连续属性,可以通过分箱、直方图分析、直观划 分等离散方法将属性的值划分为几个区间,然后就可采用和离散值处理相同的方法。由于考虑的是一组具有高还款风险物流企 业的客户的特征属性,选取企业规模、企业性质、企业地点、银行资信等级和还款风险属性来进行分类预测。 3.2 信息增益的计算。决策属性为高还款风险和低还款风险,.s。(高还款风险)=8,S:(低还款风险)=12,则信息熵I(S,,S:) 一 8l。砉一l。 =0.9710。 公司规模分为大型企业、中型企业、小型企业三组,在大型企业中具有高还款风险属性的企业有0个,具有低还款风险属 性的企业有6个,i(st,Sz)一 。gz 。 在

文档评论(0)

天狗行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档