- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
保险业务风险分析.doc
基于数据挖掘的保险业务风险分析
随着我国经济体制改革的深入发展和对外经济开放,全社会的风险意识和保险意识不断增强,保险作为风险管理的重要方法日益受到重视。我国自从1980年年恢复国内保险业务以来,保险业务得到持续高速发展,业务范围不断扩大,业务种类也不断增加。保险公司成功的一个关键因素是要在设置具有竞争力的保险费率和覆盖风险之间选择一种平衡。随着我国加入WTO,保险市场竞争将日趋激烈,设置过高的保险费率意味着会失去市场,而保险费率过低,又会影响公司的赢利甚至导致亏本。对于保险公司来说,保险是一项风险业务。保险公司的一项重要工作就是进行风险评估,它对保险公司的正常运作至关重要。如果保险公司对其保险业务风险有一个准确的科学分析和预测,制定合理的保险费率,就会在市场中立于不败之地。目前保险公司对风险的分析通常是粗略的或根据经验来判断的。本文提出利用数据挖掘技术进行风险分析,在保险公司建立的保单及索赔信息数据库的基础上寻找风险较大的领域,从而得到一些实用的控制风险的规则,指导保险公司的工作。
所谓数据挖掘,是指从已构建的大型数据库中高效地提取并发现隐含的、未知的、有潜在应用价值的模式或规则,为企业进行决策提供可靠的理论依据。数据挖掘技术包括关联规则挖掘、分类模型挖掘、特征规则挖掘以及趋势分析预测等,它综合利用统计学、机器学习和人工智能的计算、分析和推理方法,将数据转化为知识(规律)。
数据挖掘在一些专门行业已有成功的应用。例如,国外的大型商业企业,使用条码技术可收集存储大量的交易数据,对已发生的交易数据库获得有关客户购买模式的有用信息,并采取与之对应的促销措施,从而显著提高商业决策质量,取得了可观的利润回报。但数据挖掘技术在企业风险管理中的应用,尚不多见。本文以某市医疗保险数据为例,试图在这一方面作些探讨。
1、保险业数据挖掘的过程
数据挖掘是指从数据集中识别出规则或模式,它是一个多步骤的处理过程。在保险业务中数据挖掘通常包括以下几个步骤:
①、数据准备
数据挖掘的处理对象是大量的数据,这些数据一般存储在数据库系统中,是长期积累的结果。但往往不适合直接在这些数据上面进行挖掘,需要做数据准备工作,一般包括数据的选择(选择相关数据)、净化(消除冗余数据)、转换(连续型数据与离散型数据之间的转换)、数据缩减(减少数据量)
本文选用的医疗保险数据库由个人信息表、单位信息表、索赔单据表等数据表组成。各表信息如表1至表3所示。
表1:个人信息
个人保险号 姓名 性别 出生日期 单位编号 全年工资 投保日期
320105430825107 Wang 男 000278 25500 320106641218612 Zhang 女 000278 18800 320103541012503 Chen 男 000279 15400 ……………
表2:单位信息
单位编号 单位名称 地区编号 单位类别 投保日期
000158 某市教育局 05 01(事业单位) 000159 某市华宁派出所 04 01(事业单位) 000213 某市外贸公司 03 02(企业单位) …………
表3: 索赔单据
单据编号 营业员编号 个人保险号 索赔金额 索赔日期
1046101 02 320460580312404 278.50 1046102 05 320105480208127 152.80 1046201 08 320106620716280 83.30 …………
在数据准备阶段,根据直观经验去除数据中的冗余信息,例如个人姓名、性别、单位名称、投保日期、营业员编号等,统计一定时间内个人进行医疗保险索赔的次数。在个人信息表的基础上,根据单位编号获取投保人的单位信息;根据个人保险号获取投保人的索赔次数。经过数据整理工作,得到一张描述个人索赔信息的数据表格,如表4所示。
表4: 个人索赔信息数据
个人保险号 年龄 全年工资 单位类别 地区编号 索赔次数 是否索赔
3201054704
文档评论(0)