sas期末复习剖析.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
sas期末复习剖析

PROC CORR DATA = aa.class; VAR age; WITH height weight; RUN; 回归分析的内容与目的 ● 建立变量Y与X1,X2,…,Xk的经验公式(回归方程,预测公式),即从一组样本数据出发,确定出变量之间近似的数学关系式; ● 对经验公式的可信度进行检验; ● 判断每个自变量Xi(i = 1,2,…,k)对Y的影响是否显著; ● 对经验公式进行回归诊断(诊断经验公式是否适合这组数据); ● 利用合适的经验公式,根据自变量的取值对因变量的取值进行预测。 回归方程的检验(F检验) p值:检验Y和X的回归关系是否显著 回归方程是否能真实反映X和Y的关系 计算中心 回归方程的假设检验 检验y与x1,x2,…,xm之间是否有线性关系,在于检验假设: H0:β1=0,β2=0,…,βm=0 SSModel称为回归平方和,其大小反映了自变量xi(i=1,2,…,m)对y的影响程度;SSError称为剩余平方和,其大小反映了随机误差对y的作用大小。 R2越大或SSModel越大,线性回归效果越显著,SSError越大,线性回归效果越差。 SAS在回归分析的计算中,自动地在方差分析表中提供SSCTotal的分解式、平均平方和、F统计量和相应的p值。检验结果若拒绝原假设表示回归的作用是显著的,接受原假设表示回归的作用并不显著。 计算中心 自变量的筛选 常用的回归变量选择方法: 向前法(Forward):逐个加入显著的变量直到没有显著的可选变量为止。 向后法(Backward):将自变量全部加入后,逐个剔除已加入又不显著的变量,直到加入的变量都显著为止。 逐步回归法(Stepwise):在每一步都同时考虑加入显著的侯选变量及剔除已加入又不显著的变量,直到无法加入和剔除为止。 计算中心 REG过程 REG过程 PROC REG [DATA=数据集名] 选项; MODEL 因变量名表=自变量名表/选项; VAR 变量名表; FREQ 变量名; WEIGHT 变量名; ID 变量名; OUTPUT OUT=数据集名 关键字=变量名表; BY 变量名表; MODEL语句的主要选项 NOINT 规定回归模型中不包含截距 COLLINOINT 进行回归变量的共线性分析 SELECTION=FORWARD|BACKWARD|STEPWISE 筛选自变量 SLENTRY=n 进入方程变量的显著性水平 SLSTRY=n 剔除变量的显著性水平,系统默认SLS=0.10 计算中心 应用举例 【6.4】以例6.1中的资料为例,将体重作为因变量,年龄、身高与胸围为自变量,试作多元线性回归分析。 步骤1:对拟合的回归方程做一个初步的分析 PROC REG DATA=mylib.Child; MODEL weight=age height bust; RUN; 计算中心 应用举例 结果的第一部分是方差分析部分,显示了对线性回归方程的显著性检验结果,F=20.39,P=0.004,说明所求的回归方程是非常显著的。 R-Square是相关系数的平方(R^2),R^2的值越接近1,说明回归直线对观测值的拟合程度越好 结果的第二部分是参数估计部分,显示了截距及各自变量的回归系数,对截距的回归系数做t检验 回归系数为0的检验概率为为0.4988,表明不显著,提示该回归方程中应该剔除截距,同时还显示,height和bust的回归系数的t检验也不显著,而年龄的回归系数t检验的结果是显著的 计算中心 应用举例 步骤2:剔除截距,对自变量进行筛选 PROC REG DATA=mylib.Child; MODEL weight=age height bust/noint selection=stepwise sle=0.05 ls=0.05; RUN; 结果的第一部分是方差分析部分,是逐步回归的第一步,胸围变量被引入方程,对线性回归方程的显著性检验结果,F=1273.80,P0.0001,R^2=0.9914,非常接近于1,说明所求的回归方程是非常显著的。结果中的c(p) 综合了进入回归的变量个数和预测误差,模型中希望C(p)达到较小值从结果的第一部分看,c(p)= 37.4053,并不理想。 结果的第二部分,是逐步回归的第二步,年龄变量被引入方程,结果显示,胸围和年龄的回归系数t检验的结果是显著的,C(p) = 4.1644,其值比第一部中未引入年龄变量时,减少很多。 结果的第三部分显示,在0.05显著性水平下,引入方程的变量分别是胸围和年龄,身高在筛选自变量时,被踢出。 结果中

文档评论(0)

wyjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档