- 1、本文档共73页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chap09 stata与离散被解释变量模型PPT
第九章 stata与离散被解释变量模型
主要内容
1-二值选择模型
2-多值选择模型
3-排序数据模型
4-条件logit模型
5-嵌套logit模型
实验9-1:二值选择模型
一 实验基本原理
三 实验操作指导
1.建立logit模型分析
(1)使用logit模型回归
Stata中使用logit模型回归的命令语句格式如下:
logit y x1 x2 … [if] [in] [weight] [,options]
该命令中logit表示使用logit模型进行回归,相应y表示模型的被解释变量,x表示模型的解释变量,if表示logit的回归条件,in表示回归的范围,weight表示给观测值的加入权重,options的内容如下表所示:
本实验中,在Stata命令窗口中输入如下命令。
use womenwork, clear
输入此命令来打开需要的数据文件。
logit work age education married children
输入此命令对被解释变量为work,解释变量为age、education、married、children的模型使用logit模型进行回归估计。
在这个回归结果图中log likelihood即对数似然值,不断的试错迭代是logit模型的估计方法,在逐步进行回归时,通过比较不同模型的-2LL判断模型的拟合优度,选择取值更小的模型。LR chi2(4)是卡方检验的统计量,也就是回归模型无效假设所对应的似然比检验量;其中4为自由度,Probchi2 是其对应的P值,在这个估计结果显示以p=0显著说明模型的有效性。其实这两个指标与线性回归结果中F统计量和P值的功能是大体一致的。另外结果中的Pseudo R2是准R2,虽然不等于R2,但可以用来检验模型对变量的解释力,因为二值选择模型是非线性模型,无法进行平方和分解,所以没有,但是准衡量的是对数似然函数的实际增加值占最大可能增加值的比重,所以也可以很好的衡量模型的拟合准确度。此logit模型中拟合优度为0.1882。
coef是自变量对应的系数估计值,OLS通过t检验来检验估计量是否显著,logit模型通过z检验来判断其显著性;通过z检验结果可以看到此模型中系数均以p=0显著不为0。
(2)由于估计系数不像线性模型能够表示解释变量的边际效应,所以Stata中有额外的命令语句来计算解释变量的边际效应:
mfx [compute] [if] [in] [,options]
此命令语句中mfx表示对回归之后的模型计算解释变量的边际效应,其中options内容如下表所示:
本实验中,在进行logit模型回归估计后,在Stata命令窗口中输入如下命令:
mfx
此命令计算模型回归之后,解释变量取值在样本均值处的边际效应。
此输出结果显示了每一个解释变量的平均边际影响,另外读者可以自己设定计算在边际影响的点,其原理就是命令语句options中的at(atlist)将其具体化,例如“mfx, at (x1=0)”表示计算x1取值为0,其他解释变量取值在样本均值处的边际效应;而“mfx”默认是在所有解释变量在样本平均值处的边际效应。
(3)计算模型预测的百分比来计算模型的拟合优度。
如果要检验这个分类的依据或者要获得每个预测值,可以利用此二值模型进行预测分析,Stata中二值选择模型的预测的命令语句如下所示:
predict [type] newvar [if] [in] [,single_options]
其中predict是表示对模型进行预测的命令;newvar表示预测新变量的名称,type可以表明设定新变量的类型;if和in表示对此预测设定的条件和范围;single_options的内容以下表所示:
本实验中,在Stata命令窗口中输入如下预测命令,可以得到预测结果图:
predict p1, pr
此命令可以获得此模型的个体估计的值并记为新变量p1
list work p1
此命令可以将实际值与估计值对应罗列,对比看到预测值和实际值的一致程度。
(1)ROC曲线(受试者操控曲线)
此曲线是指图9.3提到的敏感性与(1-特异性)的散点图,即预测值等于1的准确率与错误率的散点图。Stata中绘画该ROC曲线命令语句为:
lroc [x] [if] [in] [weight] [,options]
其中lroc表示绘图ROC曲线命令,if和in表示对绘制图时的条件和范围的设定,weight表示对观测值的权重设定,另外命令中的自变量x不能单独使用,必须与options中beta(matname)同时使用,而options的内容如下表所示:
本实验中,在以上工作后,在命令窗口中输入如下命令绘制ROC曲线图
lroc
因为准确率就是曲线下面的面积,读此图可以看到ROC曲线
您可能关注的文档
- 8、病历书写与教学查房PPT.ppt
- 840呼吸机使用PPT.ppt
- 8中医基础理论藏象-肝PPT.ppt
- 8月急腹症的急救PPT.ppt
- 8胰岛素在糖尿病治疗中的应用PPT.ppt
- 8章 常见心肺疾病患者康复护理PPT.ppt
- 8第八章新第三节烧伤病人的护理PPT.ppt
- 8视网膜病PPT.ppt
- 8月份护理查房 2PPT.ppt
- 8月22日院内感染相关知识(李月秀)PPT.ppt
- 2023-2024学年广东省深圳市龙岗区高二(上)期末物理试卷(含答案).pdf
- 2023-2024学年贵州省贵阳市普通中学高一(下)期末物理试卷(含答案).pdf
- 21.《大自然的声音》课件(共45张PPT).pptx
- 2023年江西省吉安市吉安县小升初数学试卷(含答案).pdf
- 2024-2025学年广东省清远市九校联考高一(上)期中物理试卷(含答案).pdf
- 广东省珠海市六校联考2024-2025学年高二上学期11月期中考试语文试题.pdf
- 2024-2025学年语文六年级上册第4单元-单元素养测试(含答案).pdf
- 2024-2025学年重庆八中高三(上)月考物理试卷(10月份)(含答案).pdf
- 安徽省安庆市潜山市北片学校联考2024-2025学年七年级上学期期中生物学试题(含答案).pdf
- 贵州省部分校2024-2025学年九年级上学期期中联考数学试题(含答案).pdf
文档评论(0)