- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章 列联分析
第 7 章 分类变量的推断;性别与是否逃课有关系吗? ;性别与是否逃课有关系吗?;7.1 一个分类变量的拟合优度检验
7.1.1 期望频数相等
7.1.2 期望频数不等 ;利用Pearson-?2统计量来判断某个分类变量各类别的观察频数分布与某一理论分布或期望分布是否一致的检验方法。
比如,各月份的产品销售量是否符合均匀分布;
不同地区的离婚率是否有显著差异;
也称为一致性检验(test of homogeneity)。;7.1.1 期望频数相等;【例7-1】为研究消费者对不同品牌的牛奶是否有明显偏好,一家调查公司抽样调查了500个消费者对4个品牌的偏好情况,得到的结果如下表所示。检验消费者对牛奶品牌的偏好是否有显著差异(?=0.05)。;拟合优度检验(期望频数相等);拟合优度检验(期望频数相等);拟合优度检验(期望频数相等);拟合优度检验(使用SPSS—期望频数相等);拟合优度检验;7.1.2 期望频数不等;【例7-2】一项针对全国的房地产价格调查表明,城镇居民对房价表示非常不满意的占15%,不满意的占45%,一般的占25%,满意的占9%,非常满意的占6%。
为研究一线大城市的居民对房地产价格的满意程度,一家研究机构在某城市抽样调查300人,其中的一个问题是:“您对目前的住房价格是否满意?”调查共设非常不满意、不满意、一般、满意、非常满意5个选项。调查结果的频数分布如下表所示。检验该城市居民对房屋价格满意度评价的频数与全国的调查频数是否一致 ;拟合优度检验(期望频数不等);拟合优度检验(期望频数不等);拟合优度检验(期望频数不等);拟合优度检验(期望频数不等);拟合优度检验(使用SPSS—期望频数不等);拟合优度检验;7.2 两个分类变量的独立性检验
7.2.1 列联表与?2独立性检验
7.2.2 应用?2检验应注意的问题 ;7.2.1 列联表与?2独立性检验 ;研究两个分类变量时,每个变量有多个类别,通常将两个变量多个类别的频数用交叉表的形式表示出来;
一个变量放在行(row)的位置,称为行变量,其类别数(行数)用r表示;
另一个变量放在列(column)的位置,称为列变量,其类别数(列数)用c表示;
这种由两个或两个以上分类变量交叉分类的频数分布表称为列联表(contingency table);
一个由r行和c列组成的列联表也称为r?c列联表;
例如,本章开头的案例中,行变量“逃课情况”有两个类别,列变量“性别”也有两个类别,这就是一个2?2列联表。;对列联表中的两个分类变量进行分析,通常是判断两个变量是否独立;
该检验的原假设是:两个变量独立(无关)
如果原假设被拒绝,则表明两个变量不独立,或者说两个变量相关;
独立性检验的统计量为 :;【例7-3】利用本章开头关于学生逃课情况调查的数据,如下表所示,检验性别与逃课情况是否独立 。;?2 独立性检验(例题分析);?2 独立性检验(例题分析);?2 独立性检验(例题分析);?2 独立性检验;?2 独立性检验;7.2.2 ?2检验应注意的问题 ;在应用?2检验时,要求样本量应足够大,特别是每个单元格的期望频数不能太小,否则应用应检验可能会得出错误的结论;
从?2统计量的公式可以看出,期望频数在公式的分母上,如果某个单元格的期望频数过小,统计量的值就会变大,从而导致拒绝原假设;
应用?2检验时对单元格的期望频数有以下要求:
如果仅有两个单元格,单元格的最小期望频数不应小于5。否则不能进行?2检验;
单元格在两个以上时,期望频数小于5的单元格不能超过总格子数的20%,否则不能进行?2检验;
如果出现期望频数小于5的单元格超过20%,可以采取合并类别的办法来解决这一问题。;7.3 两个分类变量的相关性度量
7.3.1 ? 系数和Cramer’s V系数
7.3.2 列联系数 ;7.3.1 ? 系数和Cramer’s V系数;主要用于2?2列联表的相关性测量;
计算公式为:
例7—3的计算结果,得到的性别与逃课情况两个变量之间的系数为0.114891。
由于? 很小,表明性别与逃课情况不存在相关关系。这与独立性检验的结论是一致的。;由Cramer提出,计算公式为 :
Cramer’s V系数的取值范围总是在0~1之间
当两个变量独立时,V=0;当两个变量完全相关时,V=1;
如果列联表的行数或列数中有一个为2,Cramer’s V系数就等于? 系数;
例如,根据例7—3的计算结果,得到的性别与逃课情况两个变量之间的Cramer’s V系数与? 系数一致 。;7.3.2 列联系数;主要用于大于2?2列联表的相关性测量,用C表示
文档评论(0)