全面了解风控数据体系.pdfVIP

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
风控数据存储数据处理数据挖掘数据分析风控数据外部接入风控数据来源

全面了解风控数据体系 正阳 考察一个人的判断力,主要考察他信息来源的多样性。无数的可怜人,长期生活在单一的信息里,而 且是一种完全被扭曲、颠倒的信息,这是导致人们愚昧且自信的最大原因。 ——阿玛蒂亚·森(诺奖得主) 说明 传统金融的风控主要利用了信用属性强大的金融数据,一般采用20 个纬度左右的数据,利用评分来 识别客户的还款能力和还款意愿。信用相关程度强的数据维度大概在10 个左右,包含年龄、职业、 收入、学历、工作单位、借贷情况、房产,汽车、还贷记录等;而互联网金融公司在利用大数据进行 风控的同时,会根据需求利用多维度数据来识别借款人风险,维度包括但不限于:社交类数据、消费 类数据、行为类数据、多源银行账户数据等。 所以,本文结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用风控类数据做一个全 面的梳理。先来一张镇楼图: 本文核心建议阅读内容: ⚫ 多源内外部数据字典 ⚫ 三方公司风控产品清单 ⚫ 三方数据测试流程 全文总计2.4w 字,因内容较长,可分四部分进行阅读: ⚫ 1. 数据相关概念  数据定义  数据结构  数据质量  数据问题 ⚫ 2. 风控数据来源  数据应用逻辑  用户进件提供  内部系统生产  外部机构合作 ⚫ 3. 内部数据挖掘  数据收集  数据存储  数据处理  数据挖掘  数据分析 ⚫ 4. 外部数据接入  产品清单  明确需求  合作对接  离线批量测试  在线接口测试  生产环境调用 本文由正阳能量场成员:正阳、思茂及其他正阳学院成员共同完成。 本着对读者负责的态度,本文作者行文时尽可能做到以下几点:结构完整、内容真实、逻辑清晰、重 点突出、删繁就简,用关键词、数据、配图和案例体现风控数据的类型、应用、评估等。如有细节问 题,可联系作者共同探讨。 本文内容难免有疏漏,尤其是很多地方写的都较为片面,需要不断更新完善,如需了解更多,请关注 知乎“正阳”或微信公众号“正阳能量场”,多谢! 注:文中内容,如有侵权处,请联系笔者删除,感谢支持。 1.数据相关概念 1.1 数据定义 数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始 素材。数据可以是连续的值,比如声音、图像,称为模拟数据。也可以是离散的,如符号、文字,称 为数字数据。在计算机系统中,数据以二进制信息单元0,1 的形式表示。 1.2 数据结构 1.2.1 数据类型 八种基本数据类型:byte、short 、int、long、float 、double、boolean、char。 1.2.2 数据维度 从多个角度(时间、地域、机构等方面)研究一个对象的信息,其中,被研究对象为实体,研究角度 就成为维度。 1.2.3 静态数据 几乎不会改变的数据; 1.2.4 动态数据 随时间改变的数据。 动态数据与交易有关,针对不同的时期计算,如过去的1 个月、3 个月、6 个月或12 个月。 1.3 数据质量 1.3.1 数据透明度 充分评估风险所需的数据充足程度。 1.3.2 数据数量 数据的深度和广度,由可得性和同质性决定。 1.3.3 数据质量 数据能否符合某具体需求。高质量的数据应该具备相关性、准确性、完备性、时效性和一致性。关联 性、准确性、完备性、时效性、一致性、对征信机构的影响。 1.3.4 数据设计 定义数据的类型。从实践或统计的角度出发,考虑数据缺失、分母为零的特例和数据设计的问题,最 大化数据的价值。 数据类型、表格设计 1.4 数据问题 1.4.1 个人信息保护 法律规定,经过匿名化或者去身份化处理且不能复原的信息不属于个人信息。 使用目的 目的限制原则。合法合规,不能用于法律规定禁止行业。 合法合规性 确认数据合法性的边界,在合法合规的基础上对数据进行挖掘、存储、应用。 商业化、数据归属、数据窃取、数据隐私、合规输出、安全性、数据治理、数据全面、公正。 1.4.2 数据商业化 数据商业

文档评论(0)

趙山芋 + 关注
实名认证
文档贡献者

发现者9号 发现有价值的信息

1亿VIP精品文档

相关文档