- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 虚拟变量的回归模型
第一部分 学习目标和要求
本章主要介绍虚拟变量的基本概念及其应用。需要掌握并理解以下内容:
虚拟变量的基本概念、虚拟变量分别作为解释变量和被解释变量的情形、虚拟变量回归模型的类型和解释变量个数选取规则;
定量变量与不同数量定性变量(一对一、一对多和多对多)虚拟变量模型;
应用虚拟变量改变回归直线的截距或斜率;
分段线性回归;
应用虚拟变量检验回归模型的结构稳定性、传统判别结构稳定性的方法及存在的缺陷、虚拟变量法比较两个回归方程的结构方法。
第二部分 练习题
一、解释下列概念:
1.虚拟变量
2.方差分析模型(ANOVA)
3.协方差模型(ANOCVA)
4.基底
5.级差截距系数
6.虚拟变量陷阱
二、简要回答下列问题:
1.虚拟变量在线性回归模型中的作用是什么?举例说明。
2.回归模型中虚拟变量个数的选取原则是什么?为什么?
3.如果现在有月度数据,在对下面的假设进行检验时,你将引入几个虚拟变量?
A) 一年中的每月均呈现季节性波动趋势;
B) 只有双数月份呈现季节性波动趋势。
4.如果现在让你着手检验上海和深圳两个股票市场在过去5年内的收益率是否有显著差异,如何使用虚拟变量进行?
三、考虑如下模型:
其中,对前20个观察值取0,对后30个观察值取1。已知。
如何解释和?
这两组的均值分别是多少?
已知。如何计算的方差?
四、考虑如下模型:
其中代表一位大学教授的年薪;
为从教年限;
为性别虚拟变量。
考虑定义虚拟变量的三种方式:
(1)对男性取值1,对女性取值0;
(2)对女性取值1,对男性取值2;
(3)对女性取值1,对男性取值-1;
对每种虚拟变量定义解释上述回归模型。是否有某个方法比另外的更好?说明你的理由。
五、下表给出了1983年至1986年期间服装季度销售额的原始数据(单位:百万元):
年度\季度 1 2 3 4 1983 4190 4927 6843 6912 1984 4521 5522 5350 7204 1985 4902 5912 5972 7987 1986 5458 6359 6501 8607 考虑如下两个模型:
(A)
(B)
其中,:第一季度
:第二季度
:第三季度
:第四季度
回答以下问题:
估计模型(A);
解释,,,;
如何消除模型(A)中的季节性?
模型(B)与模型(A)有什么区别?
估计模型(B);
比较两个模型的结果。
六、考虑如下关于期望工作时间的对1543对夫妇调查后的回归结果(比率放在括号内):
其中为妻子希望每年花在工作上的小时数,以每年工作的小时数加上花在找工作上的时间之和计算;
:妻子税后真实时薪;
:丈夫在上一年度税后真实收入;
:妻子的年龄;
:妻子的受教育年数;
:态度变量。若被调查者愿意工作而且其丈夫也同意其工作则取值1,否则为0;
:态度变量。若被调查者的丈夫支持其工作则取值1,否则为0;
:年龄低于6岁的子女数;
:年龄在6~13岁的子女数;
回答以下问题:
各非虚拟回归元系数的符号有经济含义吗?说明你的观点。
如何解释虚拟变量和?这些虚拟变量统计显著吗?
在这项研究中,一位妇女的年龄和受教育程度不是影响其劳动力参与决策的显著因素,你认为这是为什么?
七、设有个高中毕业生和个大学毕业生构成总数为的总样本。考虑如下回归模型:
其中,表示以美元度量的小时工资;为虚拟变量,对大学毕业生取值为1,对高中毕业生取值为0。试利用公式,证明和。其中下标具有如下含义:表示高中毕业生,表示大学毕业生。
八、在51个学生(其中男生36人,女生15人)的体重(W)对身高(H)的回归分析中,得到下面的结果:
1.
2.
3.
其中体重的单位为磅,身高的单位为英寸,为乘积或差别斜率虚拟变量,为性别虚拟变量:
参考下面的相关矩阵,回答问题(1)-(6)。解释:例如,身高和性别的相关系数是,性别和交互虚拟变量的相关系数是
你将选择哪个回归?1还是2,为什么?在模型2与3中呢?
如果实际较为理想的回归是2,那么选择1说明犯了什么错误?
回归2中的性别虚拟变量说明了什么?
回归模型2中差别截距是统计显著的,但在模型3中差别斜率却是统计不显著的。如何解释这种变化?
在模型2与3中,变量
文档评论(0)