统计软件实验教学要件 实验项目十四 R软件环境下的回归分析.docVIP

统计软件实验教学要件 实验项目十四 R软件环境下的回归分析.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验项目十四 R软件环境下的回归分析 一、实验目的 运用R中的cor( )和cor.test( )函数进行一般相关分析; 运用pcor( )和pcor.test( )函数进行偏相关分析; 运用lm( )函数来实现线性回归分析,运用glm( )函数来完成Logistic回归分析; 利用predict( )函数来求预测值和预测区间,并能读懂R输出的结果。 二、实验环境 系统软件Windows2000或WindowsXP或Windows7; 统计软件R2.13.2或更高版本。 三、实验内容 运用R进行相关分析和回归分析 变量散点图的绘制 简单相关系数的计算和偏相关系数的计算 一元线性回归的估计 多元线性回归的估计 虚拟变量回归的估计 Logistic回归的估计 回归曲线的估计 第14章 回归分析 14.1 相关分析 14.2 一元线性回归 14.3 多元线性回归 14.4 虚拟变量回归 14.5 Logistic回归 14.6 曲线回归 14.1 相关分析 【例14.1】 (数据文件为li14.1.txt)为研究初中一年级男生身高x (单位:厘米)、体重z (单位:千克) 和肺活量y(单位:升) 的关系,随机抽取了16名初一男生测量得有关数据如表14.1所示: 表14.1初一男生身高、体重和肺活量的测量值 【统计理论】 给定容量为n的一个样本 ,样本简单相关系数(correlation coefficient)r的计算公式如下 【统计理论】 设三个变量x、y和z是相互关联的一组变量,那么,在控制了变量z的影响后,变量x和y的偏相关系数(partial correlation coefficient)为: (1)画散点图,观察身高x、体重z和肺活量y之间的相关关系 【软件操作】 R软件plot( )函数可以绘制散点图 setwd(D:/R-Statistics/data/chap-14) #设定工作路径 plot(dat$X,dat$Z) #绘制身高x和体重z的散点图 plot(dat$X,dat$Y) #绘制身高x和肺活量y的散点图 plot(dat$Y,dat$Z) #绘制肺活量y和体重z的散点图。 运行结果 (2)R软件cor ( )函数cor.test( ) 函数可以计算变量的相关系数并进行显著性检验 【软件操作】 运行结果 运行结果 (3)R软件pcor ( )函数pcor.test( ) 函数可以计算变量的偏相关系数并进行显著性检验 【软件操作】 运行结果 运行结果 运行结果 14.2一元线性回归 【例14.2】 (数据文件为li14.2.txt)表14.2是《华尔街日报1999年年鉴》 (The Wall Street Journal Almanac 1999)上公布的美国各航空公司业绩的统计数据:航班正点到达的比率和每10万名乘客投诉的次数。 表14.2美国航空公司航班正点率与乘客投诉率 【统计理论】 设y与x之间有直线相关关系,且y是随机变量,但x是非随机变量,它们之间的关系可以用下式表示: 【统计理论】 采用最小二乘方法可以得到回归系数的估计值为: 从而得到回归方程: 【统计理论】 回归方程的显著性检验等价于以下检验: 对于一元线性回归来说,有两种等价的方法,即F检验和t检验。F检验的统计量为: t检验的统计量如下: 【统计理论】 (1) 绘制变量散点图计算相关系数和一元线性回归 【菜单方式】 setwd(D:/R-Statistics/data/chap-14) #设定工作路径 dat=read.table(li14.2.txt,header=T) #从li14.2.txt中读入数据,记为dat plot(y~x,data=dat) #绘制x和y的散点图 cor(dat) #计算x和y的相关系数 运行结果 【菜单方式】 fitlm=lm(y~x,data=dat) #建立y关于x的回归方程 anova(fitlm) #输出回归方程的方差分析表 summary(fitlm) #输出回归分析结果。 运行结果 运行结果 (2)如果航班正点率为80%,对每10万名乘客投诉的次数进行预测 【菜单方式】 newdat=data.frame(x=80) #给定x的值为80,记为newdat predict(fitlm,newdat,interval=predict) #对y的个值进行预测 predict(fitlm,newdat,interval=“confidence”) #对y的均值进行估计。 运行结果 6.3 多元线性回归 【例14.3】(数据文件为li14.3.txt)某公司经理想研究公司员工的年薪问题,根据初步分析,他认为员工的当前年薪y(元)与员工的开始

文档评论(0)

1243595614 + 关注
实名认证
文档贡献者

文档有任何问题,请私信留言,会第一时间解决。

版权声明书
用户编号:7043023136000000

1亿VIP精品文档

相关文档