7-第8章节数据挖掘模型评估.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
7-第8章节数据挖掘模型评估

Response rate =预测会违约且实际会违约/所有预测会违约 =66/(66+28)=70.21% 预测模型回应率的高低须和总体回应率比较: 总体response rate =总体实际会违约/总体=(66+185)/(66+185+28+721)=25.1% * * 预测值 1 0 1(实际“会违约”) 66 185 0(实际“不会违约”) 28 721 ?回应率(response rate):在预测的名单中找出有多少小概率事件(在预测违约的名单中,真正违约的所占比例是多少)。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 可以发现,原始回应率为25.1%,运用数据挖掘模型提升为70.21%,因此回应率提升了2.8倍。 回应率讲究的是模型“宁缺勿滥”的能力。 回应率高并不代表一定是好模型,因为如果利用数据挖掘模型从一万人中挑出10个最有可能会买产品的顾客,结果回应率是100%,但是却漏掉了大多数会买产品的顾客,因此,还得参考“反查率”这个指标。 * * Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Recall =预测会违约且实际违约/所有实际会违约 =66/(66+185)=26.29% 它的意义在于:预测出来会违约的人占了总体会违约的客户多少百分比。反查率越高,表明犯第二类错误的可能性越小,那么模型越好。 * * 预测值 1 0 1(实际“会违约”) 66 185 0(实际“不会违约”) 28 721 ?反查(recall):预测出来的小概率事件占总体小概率事件的比例是多少。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 完美的预测模型反查率是100%,但是反查率与回应率是互相矛盾的。 recall=67/(67+184)66/(66+185) Response rate=67/(67+38)66/(66+28) * * 预测值 1 0 1(实际“会违约”) 67 184 0(实际“不会违约”) 38 711 预测值 1 0 1(实际值) 66 185 0(实际值) 28 721 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Range reduce =预测会违约/总体=(66+28)/(66+28+721+185) =9.4% 间距缩减代表的是根据模型执行活动时的成本,当如果名单量没有有效缩减时,执行的总成本会很高,因此间距缩减越低越好。 * * 预测值 1 0 1(实际值) 66 185 0(实际值) 28 721 ?间距缩减(range reduce):通过DM模型来找出小概率事件时,名单缩小了多少。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 从上述三个指标来看,这个预测模型可以让名单缩减至原来的9.4%,但是却只包含了总体26.29%会违约的人(反查率),让回应率提升了原先的2.8倍。 * * Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 很少有模型同时能够满足上述三个指标的要求,当回应率很高时,一定是筛选高概率族群,因此名单间距缩减一定会变低,但是会遗漏掉低概率族群必定会造成反查降低,所以若只看分类矩阵,找不出最好的模型。 分类矩阵是根据一个概率阀值将顾客分作两种情况,过度简化了实际的结果。因为所有的演算法除了预测结果之外,同时还会提供概率值作为排序的基准。 * * Evaluation only. Created with Aspose.Slides for .NET 3.5 Cl

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档