人工智能基础与应用(第2版)(微课版)课件 3-4 项目2—预测投保人医疗费用.pptx

人工智能基础与应用(第2版)(微课版)课件 3-4 项目2—预测投保人医疗费用.pptx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

3-4项目2—预测投保人医疗费用模块?线性回归:预测未来趋势

目录CONTENTS提出问题01预备知识03解决方案02任务1—加载数据并进行数据预处理04任务3—进一步改善模型性能06任务2—训练和测试医疗费用预测模型05

一.提出问题问题描述我国农村医疗保险和全民医保制度的全面实施,缓解了广大人民群众“看病贵”的问题,提高了人民群众的生活质量,也改变了人们对保险的认识,越来越多人的接受和认可商业保险。与此同时,医疗保险公司作为一种商业经营实体,对投保人在未来可能发生的医疗费用进行预测,这是医疗保险公司回避风险、提高经营利润的一种保障措施。如何能得到一个较为精准的医疗费用预测模型呢机器如何去学习预测?

二.解决方案1.问题本质医疗费用预测问题,就是试图从投保人的特征变量入手,通过机器学习提供的某种模型,如线性回归等,来寻找一个医疗费用与投保人特征相关的函数表达式。仍然采用多元线性回归来求解问题

二.解决方案2.解决方案

三.预备知识1.DataFrame数据的检索用途:从数据集中切分出需要的数据loc方法使用名称检索iloc方法使用索引号检索

三.预备知识1.DataFrame数据的检索示例:运行结果

三.预备知识2.DataFrame数据的更改1)按索引条件直接更改:结果

三.预备知识2.DataFrame数据的更改2)用apply方法更改:结果

四.任务1——加载数据并进行数据预处理1.导入相关库并加载数据读取的数据

四.任务1——加载数据并进行数据预处理2.数据清洗和转换对数据进行转换,以方便机器学习

四.任务1——加载数据并进行数据预处理3.数据的归一化处理归一化后的样本数据

五.任务2——训练和测试医疗费用预测模型1.构建线性回归模型构建线性回归模型

五.任务2——训练和测试医疗费用预测模型2.准备训练集和测试集按7∶3的比例分为训练集和测试集

五.任务2——训练和测试医疗费用预测模型3.模型训练和测试运行结果

五.任务2——训练和测试医疗费用预测模型4.预测结果可视化可视化结果

六.任务3——进一步改善模型性能1.改进方向01分析样本特征的相关性。Age与bmi强相关

六.任务3——进一步改善模型性能1.改进方向02考虑模型中是否存在非线性变量。处理办法

六.任务3——进一步改善模型性能1.改进方向03评估连续性变量的影响是否也是连续的。处理办法

六.任务3——进一步改善模型性能1.改进方向改进举例:消除bmi和smoker的共同作用

六.任务3——进一步改善模型性能1.改进方向改进后的效果:相对于前一个模型,改进后的模型得分一下子提高到0.869,说明此模型能更好地解释医疗费用的变化,这可能提示肥胖吸烟者对医疗费用的影响是巨大的。

六.任务3——进一步改善模型性能2.预测费用预测费用:

人工智能基础与应用Thankyouverymuch!

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档