医疗保险中小样本信息处理两种模型.docVIP

医疗保险中小样本信息处理两种模型.doc

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医疗保险中小样本信息处理两种模型

医疗保险中小样本信息处理两种模型   一、引言      商业健康保险是我国建立和发展多层次医疗保障体系的重要内容,而以报销住院费用为保险标的的保险形式是商业健康保险中最常见的形式之一。而在设计医疗保险产品时,风险分析和评估一直是必须考虑的问题之一。在许多情况下,由于种种条件的限制,只能搜集到少量的样本,即小样本。如保险中的豁免数据,健康险中的各种重大疾病患病情况数据等等。因此在数据缺乏的基础之上,如何充分利用有限的样本点来较精确的估计每次住院费用的分布对于商业健康保险产品的费用厘定有着重要的意义。   概率密度的核估计方法自Rosenblatt(1955年)和Parsen(1962年)提出以来,由于其优良的统计特性和使用简便而迅速发展起来。核估计方法具有较参数估计方法适用范围广,较直方图方法估计精确且光滑性好等特点。运用核估计方法处理大样本信息,是统计学中常用的一种手段。但核估计方法来处理、解决、分析保险精算中小样本信息,在国内鲜见报道、登载。本文将核估计方法用于一个实际项目的研究,解决了一维小样本问题。   该项目的数据资料为某市参加基本医疗保险的366363位20岁以上参保职工在2000年7月到2001年6月一年间共27365次住院的费用记录,其中男性14370人次,女性13265人次。本文通过利用核估计方法、信息扩散方法、信息扩散的参数优化方法对每次住院费用的年龄分布密度进行了估计(由于篇幅有限,本文只以女性20-40岁的住院费用为例),其具体做法是:1.利用核估计方法处理的大样本结果作为检验标准(以前是以直方图方法处理的大样本结果作为检验标准)2.利用核估计方法和信息扩散方法同时处理小样本问题,并将结果加以比较,说明信息扩散方法处理小样本问题的有效性3、引入两个准则,建立优化模型,结果比较理想。      二、数学模型      1.核估计的定义和窗宽的选择   设?Y?1,Y?2……Y?n是随机变量的简单随机子样,f(y)是Y的概率密度函数,K(?)为上一个给定的概率密度函数,h?n>0是一个与n有关的常数,记   f?n(y)=f?n(y;Y?1,Y?2,…Y?n)=1nh?n∑ni=1k(y-Y?ih?n)   则称f?n为总体未知密度函数f的一个核估计,称K(?)为核函数,称h?n为窗宽。   核估计方法得到的概率密度函数不仅和样本有关,还与核函数的选择以及窗宽的选择有关。本文选取标准正态密度函数为核函数,选取窗宽h?n=CQn?15。   2.信息扩散方法定义   在上述定义和选择的基础上,本文相关的信息扩散方法定义为:   定义1 设V是知识样本,W是基础论域,所谓关于V的一种信息扩散,就是V×W到[0,1]上的一个映射:μ:V×W→[0,1],且满足下列三个条件:(1)?v?j∈V,如w?j是v?j的观测值,则μ(v?j,w?j)=?sup?w∈Wμ(v,w?j);(2)?v?j∈V,μ(v?j,w?j)随||w?j-w||数值的增加而递减;(3)?v∈V,∫?wμ(v,w)dw=1其中,如W为离散情形,∫?W表示∑W。   定义2扩散的范围被定义为欧几里得距离R。如果R?是有限的(无限的),就称为有限维(无限维)信息扩散。   3.信息扩散方法的参数优化问题   信息扩散的性质不仅依赖于给定的样本,也与参数λ的选择有密切的关系。随着参数λ的变化,从几何上讲会引起曲线或曲面的波动的增加或减小,因此通过优化参数λ对扩散函数进行改进,这是本文一个重要工作之一。其原则是既要从一定程度上反映给定样本的性质,   同时又希望曲线或曲面的波动性尽量的小。为此,建立如下准则:  ??准则1:最小波动准则 信息扩散函数参数的选择应该使患病率曲线(面)波动最小。数学表达式为:F(λ)=∫ba??2p?λ?w?2?2dw   准则2:有限偏离度准则 信息扩散所得到的患病率偏离给定样本不远。该准则作为约束条件,衡量方法是借鉴图形相似的判别方法,其数学表达式为:   C(λ)=∑i(f?i?O*f?i?d(λ))(∑i(f?i?O)?2∑i(f?i?d(λ))?2)?12   其中f?0?i表示原始小样本在给定子域Ω?i上的住院费用对数的频数,f?d?i(λ)表示经过信息扩散后得到的住院费用对数的频数。则信息扩散的优化参数模型为?min?F(λ);s.t.C(λ)≥ε,其中ε为相似指数。      三、项目研究      1.大样本   将住院费用数据按性别和年龄段分成12组,分别为20-29岁,30-39岁,40-49岁,50-59岁,60-69岁,70岁以上。对住院费用取取核函数K(x)=12πe??-x?22?,分性别和年龄用核估计方法对住院费用进行分析,其结果

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档