基于反向传播(BP)算法的核保风险分析模型探讨.docVIP

基于反向传播(BP)算法的核保风险分析模型探讨.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于反向传播(BP)算法的核保风险分析模型探讨.doc

基于反向传播(BP)算法的核保风险分析模型探讨   摘 要:以高血压疾病建立风险判别的模型为例,对投保人和其风险类别加以判断。在这一过程中我们选取一些相关性相对较强的因素,之后将项目数据库当做是风险判别模型建立的一个数据基础,此外还要使用反向传播的算法建立一个有效的模型。最后还要不断的对训练集的样本数进行适当的改变和调整,这样也就可以更好的对模型的精度进行有效的检验。模型和投保人患病判别的吻合程度达到了80%以上,所以在操作性上也存在着比较强的优势。本文主要探讨了基于反向传播(BP)算法的核保风险分析模型,以供参考和借鉴。   关键词:高血压;反向传播方法;风险分析;判别模型   当前商业医疗保险当中对投保人的病情风险进行科学合理的判断成为了人们一直都非常关心和关注的问题。商业医疗保险本身赔付率比较高,同时在风险管理过程中也有很多的障碍和不足,所以我国的商业医疗保险一直都得不到很好的发展本文的研究中对某社区的一项富裕性疾病调查建立了数据库。首先是利用了Kendall的方法来挑出了和高血压患病相关性不是很强的因素。之后将这一项目数据库当中的所有记录当做是风险判别模型的数据集,采用反向传播算法完成模型的创建。最后采取有效的措施对训练的样本数进行一定的改变和调整,这样就可以对模型的精确程度进行有效的检查。如果样本数达到了其总量要求的时候,模型对投保人患病判别的吻合率达到了80%以上。   1 数学模型   1.1 Kendall相关性检验   在研究中,顺序变量(X,Y)完全按照离散分布进行处理,其样本观测数值会产生非常明显的数据重复现象,因此我们在研究的过程中通常采用的是Kendall完成统计工作。   1.2 BP算法   BP算法通常就是应用在前馈多层网络的学习算法,前馈多层的网络结构也有其自身的特征。   其具有输入层、输出层和处于输入输出层的中间层。中间层有单层或者是多层。因为它们和外界之间并不存在这非常密切的联系,所以也被人们叫做是隐层,在隐层中的神经元通常也被人们叫做隐单元。隐层和外界之间虽然并不存在这非常密切的联系,但是它运行的状态会对输入输出层之间的关系产生非常重大的影响。从某种角度上来说,它能够对多层的神经网络性能加以调整和改善。   反向传播算法通常分成两部进行,也就是正向传播和反向传播,其工作的流程如下:   首先是正向传播。输入样本从输入层会经过隐形单元对其进行逐层的处理。在经过了所有的隐形层之后就传给了输出层。在对其进行逐层处理的过程中,每一层的神经元状态只能对下一层神经元的状态产生一定的影响。在输出层将现行输出和期望输出进行了全面的对比之后,如果现行的输出和期望的输出不相等,这个时候就要开展反向传播的过程。   其次是反向传播。在反向传播的时候,将误差信号按照原有的正向传播路径进行反向的传播,同时还要对每一个隐层的每个神经元的权系数进行适当的调整,这样就可以使得误差信号降到最低的水平。   2 研究项目   2.1 相关性分析   采用专业的软件分别对十六个因子变量的Kendall统计值进行计算,同时在这一过程中还要按照相关的专业医学知识将0.1作为统计值的分界,选择出和高血压患病程度相关度比较高的前六个变量,它们是高血压家族史、冠心病程度、年龄、BMI指标、高血脂程度和糖尿病的程度。   2.2 BP算法判别方法   按照对风险因素的分析,从数据库中的32个字段当中选择出6个字段,同时还要在这一过程中和上文的留个变量相对应来建立本网络模型所需要的数据记录。   在软年当中用以下的命令来对网络结构进行构建:   也就是说这一神经网络输入层当中有6个结点。一层隐含层当中有13个结点,输出层当中有一个节点,它是高血压患病的实际情况。如果高血压严重的程度为1,2,3的时候,输出值为1的话就证明这个人患有高血压,如果高血压严重程度为0的时候,输出值就是0,证明此人没有高血压病症。其中,PR是6列数据的基本数据值,在分析当中,我们需要将其当做是重要的基础进行判别和分析。   选取数据库中的17000条记录当做训练集,将上文提到的6个指标当作输入神经元,预期对应的高血压患者的病情当做是输出值对网络进行一定的处理,在软件当中主要通过以下的命令来实现这一功能。   net=train(net,TX,TY)   其中,TX为17000条以高血压家族史、冠心病程度、年龄、BMI指数、高血脂程度以及糖尿病程度为字段的数据记录,TY为与TX对应的高血压患病情况。   最后是要选取数据当中的另外1000条记录当成是测试集,使用训练之后的网络对其进行有效的判断,这样就可以对BP算法基础上的神经网络模型对疾病预测的效果进行检验。在对检验结果进行分析之后发现,这一模型对训练集的判别

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档