实用回归分析实验 (R软件的使用).ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4、同方差性(四种方法) 1.plot(lm.baoxian) library(car) spreadLevelPlot(lm.baoxian) 画出标准化残差绝对值与拟合值之间的关系,从图形中可知点在水平的最佳拟合曲线周围呈水平随机分布,基本满足同方差的假定,代码结果建议幂次变换。 (若不满足你将会看到一个非水平的曲线。) x-x^(0.3817295 ) lm.baoxian1-lm(y~x) spreadLevelPlot(lm.baoxian1) 斯皮尔曼等级相关系数 y.res-residuals(lm.baoxian) cor.test(y.res,x,method=spearman) ncvTest(lm.baoxian)#检验同方差性 5、线性模型的综合检验 gvlma包中gvlma命令 Pena和Slate(2006)年编写,能对线性模型假设进行综合验证,同时还能做偏倚度、峰度和异方差性的检验。即它给模型提供一个单独的综合检验(通过或者不通过) 6、多重共线性检验(多元回归中) car包中vif vif(lm.baoxian) 7、异常观测值 离群点、高杠杆值点和强影响点 1.离群点:那些模型预测效果不佳的观测点,它们通常有很大的、正或者负的残差,正的残差说明模型低估了响应值,负的残差说明高估的响应值。 qqPlot落在置信带外的点可以认为是离群点。或者利用outlierTest命令检验离群点 outlierTest(lm.baoxian) 高杠杆值点: 即是与其他预测变量有关的离群点或者说是 hat.plot-function(fit){ p-length(coefficients(fit)) n-length(fitted(fit)) plot(hatvalues(fit),main=Index Plot of Hat Value) abline(h=c(2,3)*p/n,col=red,lty=2) identify(1:n,hatvalues(fit),names(hatvalues(fit))) } hat.plot(lm.baoxian) 强影响点 对模型参数估计值影响有些比例失衡的点。若移除模型的一个观测点模型会发生巨大的变化,那么就要检测一下数据中是否有强影响点。 avPlots(lm.baoxian,ask=FALSE,id.method=“identify”) plot(lm.baoxian,4) 改进措施 1.删除观测点2.变量变换3.添加或者删除变量(第五章)4.使用其它回归模型(第九章、第十章) 2、变量替换 当不符合正态性、线性或者同方差性时,一个或者多个变量的变换通常可以改善或者调整模型效果。 0 : log(y) logit:log(y/(1-y))其中y为比例数 box-cox变换P115 y.rst-rstandard(lm.baoxian)###标准化残差 教材120删除残差 8、残差分析图及解释 y.fit-predict(lm.baoxian)##yi的预测值 plot(y.res~y.fit) y.rst-rstandard(lm.baoxian)###标准化残差 plot(y.rst~y.fit)###画标准化残差图 plot(lm.baoxian) 残差QQ图##检验残差是否符合线性回归模型的假定 plot(lm.baoxian,2) plot(y.res~x)##横坐标为x的残差图 plot(lm.baoxian,1)#普通残差与拟合值的残差的图 plot(lm.baoxian,3)#标准化残差的开方与拟合值的残差图 plot(lm.baoxian,4)#画cook统计量 par(mfrow=c(2,2)) plot(lm.baoxian)#画四个图 残差分析: 从上图中看残差的散点图均值在0,再看红色的线条,说明残差的散点图有一定的规律,不满足误差等方差的假定,也不满足线性回归的假设。红线表明残差中还有些规律,我们的一元线性回归模型没有找出规律,即模型不合适。 Q-Q图解释 从图中看实际数据的分位点和标准正态分布的理论分位点基本在一条直线上。有几个点不在直线上也正常,数据的随机性 三、回归诊断(要安装加载包“car”) 1、误差的正态性检验 基础包内的 plot(lm.baoxian,2)##检验残差是否符合正态分布 qqPlot(lm.baoxian)##car包中命令 residplot画残差的直方图和概率密度图与理论的正态分布进行比较。 K-S检验 ks.test shapiro.test ##正态性检验 2、误

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档