大数据挖掘助力互联网金融风险操纵.docVIP

大数据挖掘助力互联网金融风险操纵.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据挖掘助力互联网金融风险操纵

大数据挖掘助力互联网金融风险控制 而这些人却有可能在央行征信系统外的其它机构、互联网金融公司自己的数据系统中,存有相 应的信贷记录。市场上一些线下小贷公司、网络信贷公司对于借贷人的信用评级信息需求非常旺盛,也因此催生了若干市场化征信公司,目前国内较大的具有代表性 的市场化征信公司有几家:如北京安融惠众、上海资信、深圳鹏元等等。 从P2P网贷公司和一些线下小贷公司采集动态大数据,为互联网金融企业提供重复借贷查询、不良用户信息查询、信用等级查询等多样化服务是目前这些市场化的征信公司正在推进的工作。而随着加入这个游戏规则的企业越来越多,这个由大量动态数据勾勒的信用图谱也将越来越清晰。 互联网海量大数据中与风控相关的数据 互联网大数据海量且庞杂,充满噪音,哪些大数据是互联网金融企业风险控制官钟爱的有价值的数据类型?下图为大家揭示了互联网海量大数据中与风控相关的数据,以及哪些企业或产品拥有这些数据。 (图)风控相关大数据及代表企业或产品 利用电商大数据进行风控,阿里金融对于大数据的谋划可谓非一日之功。在很多行业人士还在 云里雾里的时候,阿里已经建立了相对完善的大数据挖掘系统。通过电商平台阿里巴巴、淘宝、天猫、支付宝等积累的大量交易支付数据作为最基本的数据原料,再 加上卖家自己提供的销售数据、银行流水、水电缴纳甚至结婚证等情况作为辅助数据原料。所有信息汇总后,将数值输入网络行为评分模型,进行信用评级。 信用卡类网站的大数据同样对互联网金融的风险控制非常有价值。申请信用卡的年份、是否通 过、授信额度、卡片种类;信用卡还款数额、对优惠信息的关注等都可以作为信用评级的参考数据。国内最具代表性的企业是成立于2005年,最早开展网上代理 申请信用卡业务的“我爱卡”。其创始人涂志云和他的团队又在2013年推出了信用风险管理平台“信用宝”,利用“我爱卡”积累的数据和流量优势,结合其早 年的从事的FICO(费埃哲)风控模型,做互联网金融小微贷款。 利用社交网站的大数据进行网络借贷的典型是美国的Lending Club。Lending club于2007年5月24日在facebook上开张,通过在上面镶嵌的一款应用搭建借贷双方平台。利用社交网络关系数据和朋友之间的相互信任聚合人 气。借款人被分为若干信用等级,但是却不必公布自己的信用历史。 在国内,2013年阿里巴巴以5.86亿美元购入新浪微博18%的股份,其用意给人很多遐想空间,获得社交大数据,阿里完善了大数据类型。加上淘宝的水电煤缴费信息、信用卡还款信息、支付和交易信息,已然成为了数据全能选手。 小贷类网站积累的信贷大数据包括信贷额度、违约记录等等。但单一企业缺陷在于数据的数量 级别低和地域性太强。还有部分小贷网站平台通过线下采集数据转移到线上的方式来完善信用数据。这些特点决定了如果单兵作战他们必定付出巨大成本。因此,贡 献数据,共享数据的模式正逐步被认可,抱团取暖胜过单打独斗。其中有数据统计的全国小贷平台有几百家,全国性比较知名的有人人贷、拍拍贷、红岭和信用宝 等。 第三方支付类平台未来的机遇在于,未来有可能基于用户的消费数据做信用分析。支付的方向、每月支付的额度、购买产品品牌都可以作为信用评级的重要参考数据。代表产品为易宝、财付通等。 生活服务类网站的大数据如水、电、煤气、有线电视、电话、网络费、物业费交纳平台则客观真实地反映了个人的基本信息,是信用评级中一类重要的数据类型。代表产品为平安的“一账通”。 互联网金融风控大数据加工过程 (图)大数据加工过程图解析 如上图所示,在进行数据处理之前,对业务的理解、对数据的理解非常重要,这决定了要选取哪些数据原料进行数据挖掘,在进入“数据工厂”之前的工作量通常要占到整个过程的60%以上。 在数据原料方面,越来越多的互联网在线动态大数据被添加进来。例如一个虚假的借款申请人 信息就可以通过分析网络行为痕迹被识别出来,一个真实的互联网用户总会在网络上留下蛛丝马迹。对征信有用的数据的时效性也非常关键,通常被征信行业公认的 有效的动态数据通常是从现在开始倒推24个月的数据。 通过获得多渠道的大数据原料,利用数学运算和统计学的模型进行分析,从而评估出借款者的 信用风险,典型的企业是美国的ZestFinance。这家企业的大部分员工是数据科学家,他们并不特别地依赖于信用担保行业,用大数据分析进行风险控制 是ZestFinance的核心技术。他们的原始数据来源非常广泛。 他们的数据工厂的核心技术和机密是他们开发的10个基于学习机器的分析模型,对每位信贷申请人的超过1万条原始信息数据进行分析,并得出超过7万个可对其行为做出测量的指标,而这一过程在5秒钟内就能全部完成。 事实上,在美国,征信公司或者大数据挖掘公司的产品不仅用于提供给相关企业用于降低金融信贷行业的风险,同时也

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档