用r也能做精算 actuar 包学习笔记(一) - 中国统计学.pdfVIP

用r也能做精算 actuar 包学习笔记(一) - 中国统计学.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用r也能做精算 actuar 包学习笔记(一) - 中国统计学

用R 也能做精算—actuar 包学习笔记 (一) 李皞 (中国人民大学统计学院 风险管理与精算) 本文是对R 中精算学专用包actuar 使用的一个简单教程。actuar 项目开始于2005 年,在 2006 年 2 月首次提供公开下载,其目的就是将一些常用的精算功能引入R 系统。 actuar 是一个集成化的精算函数系统,虽然其他R 包中的很多函数可以供精算师使用,但 是为了达到某个目的而寻找某个包的某个函数是一个费时费力的过程,因此,actuar 将精 算建模中常用的函数汇集到一个包中,方便了人们的使用。目前,该包提供的函数主要涉及 风险理论,损失分布和信度理论,特别是为非寿险研究提供了很多方便的工具。 如题所示,本文是我在学习 actuar 包过程中的学习笔记,主要涉及这个包中一些函 数的使用方法和细节,对一些方法的结论也有稍许探讨,因此能简略的地方简略,而讨论的 地方可能讲的会比较详细。文章主要是针对 R 语言的初学者,因此每种函数或数据的结构 进行了尽可能直白的描述,以便于理解,如有描述不清或者错漏之处,敬请各位指正。闲话 少提,下面就正式开始咯! 1 数据描述 本节介绍描述数据的基本方法,数据类型主要分为分组数据和非分组数据。对于非分组 数据的描述方法大家会比较熟悉,无论是数量上,还是图形上的,比如均值、方差、直方图、 柱形图还有核密度估计等。因此下文的某些部分只介绍如何处理分组数据。 1.1 构造分组数据对象 分组数据是精算研究中经常见到的数据类型,虽然原始的损失数据比分组数据包含有更 多的信息,但是某些情况下受条件所限,只能获得某个损失所在的范围。与此同时,将数据 分组也是处理原始数据的基本方法,通过将数据分到不同的组中,我们可以看到各组中数据 的相对频数,有助于对数据形成直观的印象(比如我们对连续变量绘制直方图);而且在生 存函数的估计中,数据量经常成千上万,一种处理方法是选定合适的时间或损失额度间隔, 对数据进行分组,然后再使用分组数据进行生存函数的估计,这样可以有效减小计算量。现 在假设我们要把一组连续变量分为r组: ,那么就需要定义r+1 个边界 。实际中的损失数据或生存数据都是取非负值,因此 经常取0。 对于分组数据来说,只需要知道每个组的数值范围及落在该组的观测频数,因此要构造 一个完整的分组数据只需要提供上面两个信息即可。下面是分组数据的构造函数,注意这个 函数是构造一个分组数据的结构,而非对现有连续数据进行分组,该函数返回一个分组数据 的对象(grouped data object)。 函数语法: gouped.data(Group=c(…),freq1=c(…),freq2=c(….),….,right=TRUE,ro w.names=NULL) 用法说明: 1)Group 定义的是分组的边界值,freq1 和 freq2 (还可以定义freq3 及更多)是每 条分组数据的频数。Group,freq1和freq2可以随意命名,比如我们可以将Group 改为“分数档”,将 freq1,freq2 改为“一班”,“二班”等,那么“一班”,“二班”就 是两条分组数据,有着共同的分组数据边界值。要注意,一定要把边界值向量放在第一 个参数的位置! 2)Group 向量要比freq 向量多出一个长度(边界数比组数多1)。 3)默认分组区间是左开右闭,如果想变为左闭右开可以设置right=FALSE。row.names 可以自定义行的名称。 4)返回的是一个数据框。特别要注意对第一列的处理,见下面例子。 例子: x=grouped.data(Group= c(0, 25, 50, 100, 150,250, 500), + Line.1 = c(30, 31, 57, 42, 65, 84), + Line.2 = c(26, 33, 31, 19, 16, 11)) x Group Line.1 Line.2 1 (0, 25] 30 26 2 (25, 50] 31 33 3 (50, 100] 57 31 4 (100, 150] 42 19 5

文档评论(0)

精华文库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7111022151000002

1亿VIP精品文档

相关文档