- 1、本文档共48页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
教学课件讲义PPT教案幻灯片学习资料
The long-long form The wide-year long-sex form The wide-wide form The long-year wide-sex form Reshape命令详细解释:包括矩阵转置等 Reshape命令 *From long-long form to long-wide form reshape wide @inc, i(hid year) j(sex) string *From long-wide form to long-long form reshape long @inc, i(hid year) j(sex) string *From long-long form to wide-long form reshape wide inc, i(hid sex) j(year) *From wide-long form to long-long form reshape long inc, i(hid sex) j(year) *From long-wide form to wide-wide form reshape wide minc finc, i(hid) j(year) *From wide-wide form to long-wide form reshape long minc finc, i(hid) j(year) *From wide-long form to wide-wide form reshape wide @inc90 @inc91, i(hid) j(sex) string *From wide-wide form to wide-long form reshape long @inc90 @inc92, i(hid) j(sex) string @ :如果变量为字符型,如sex的值为f和m,要把inc变量生成finc和minc,则需要用@。 Collapse 命令 产生新的数据集 collapse (统计量) 变量, by (变量) collapse (mean) price, by(foreign) collapse (mean) mprice=price (sum) sprice=price, by(foreign) table foreign,c(mean price sum price) replace 统计功能 描述统计 交叉表格 估计 第四章 多元线性回归模型检验 拟合优度检验 方程的显著性检验(总参数的F检验) 变量的显著性检验(单参数的t检验) 构造置信区间 3.2 拟合优度检验 可决系数与调整的可决系数 1. 总离差平方和的分解 观测值对均值的 分散程度、偏离程度 拟合值对均值的 分散程度、偏离程度 观测值对拟合值的 分散程度、偏离程度 由于 =0 所以有: 有意思的是: 条件:模型必须有截距项 2. 可决系数 该统计量越接近于1,模型的拟合优度越高。 问题: 在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大(?) 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。 但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。 3. 调整的可决系数 在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响: 其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。 一、方程的显著性检验(F检验) 方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。 1、检验假设 即检验模型 Y=?1+?2X2+ ? +?kXk+ 中的参数?i是否显著不为0。 可提出如下原假设与备择假设: H0: ?2=?3= ? =?k=0 H1: ?i不全为0 3.3 统计推断 F检验的思想来自于总离差平方和的分解式: TSS=ESS+RSS 如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。 因此,可通过该比值的大小对总体线性关系进行推断。 根据数理统计学中的知识,在原假设H0成立的条件下,统计量 服从自由度为(k-1 , n-k)的F分布 给定显著性水平?,可得到临界值F?(k-1,n-k),由样本求出统计量F的数值,通过 F? F?(k-1,n
文档评论(0)