第十章 资料的统计分析(Ⅱ)PPT.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 资料的统计分析(Ⅱ)PPT

3.X2检验 为了便于分析交量间的关系,一船是采用相对频数即百分比的形式列出交互分类表。这样,既可以很直观地比较某一变量的不同类别在另一变量上的分布情况,也可以从中推断二者之间的关系。 X2检验的计算公式 式中,f0为交互分类表中每一格的观察频数,fe为交互分类表中f0所对应的期望颇数。 为了计算x2,必须先计算出每一格f0所对应的fe(即期望频数),具体的计算方法是:用每一个f0所在的行总数乘以它所在的列总数,再除以全部个案数。下面我们用表10-7的资料为例进行说明。首先,我们将表10-7还原成频数形式的交互分类表(见表10-8)。 知道了x2的计算方法,我们再来看看x2检验的具体步骤。以上表为例。 首先,建立两变量问无关系的假设,即设年龄与对提前退休的态度两变量相互独立,互不相关。然后计算出x2值。再根据自由度df=(r-1)(c-1)和给出的显著性水平,即P值,查x2分布表,得到一临界值。自由度计算公式中的r和c分别为交互分类表的行数和列数,因此,本例的自由度为:df=(2-1)(3-1)=2。假定给出的显著性水平为P=0.05,由书后的x2分布表可查得临界值为5.991。 将计算出的x2值与查得的临界值进行比较,若x2值大于或等于临界值,则称差异显著,并拒绝两变量独立的假设,也即承认两变量间有关系;若x2值小于临界值,则称差异不显著,并接受两变量独立的假设,即两变量间无关系。在本例中,由于X2=68.36>5.991,所以我们可以否定年龄与对提前退休的态度之间无关系的假设,得出在总体中二者有关系的结论。 对于交互分类来说,x2检验发挥着这样两种作用:一是对两变量的相关关系是否存在进行审查,此时X2检验又称作独立性检验(即两变量是相互独立,还是彼此相关);二是对较小规模的样本资料进行差异的显著性检验,即核查交互分类表中所出现的分布差异究竟是由于随机抽样的误差所引起,还是由于总体中的分布状况所导致。 x2检验也有其弱点。这主要是由于x2值的大小不仅与数据的分布有关,同时它还与样本的规模有关。当样本足够大时,一些很小的分布差异也可以通过x2检验达到显著性水平。 4.关系强度的测量 几种常见的与交互分类有关的变量间关系强度的测量方法 (1) ?系数。当交互分类表为2× 2表(即两行两列)时,可用?系数测量变量关系的强度。 ?系数的计算公式 ?的取值范围在0与1之间,越接近1,说明关系强度越大。现以表10—12的资料为例来计算? 。 (2) V系数。由于?系数除了在2x 2表中可控制在[-1,+1]之间外,当r x c表的格数增多后, ?值将增大,因而此时的?值是没有上限的,这样系数间就缺乏比较。为此人们又作了进一步改进,出现了其他几种以X2为基础的关系强度系数公式。其中的V系数公式为 式中的分母表示以(r—1)和(c—1)中较小者作为除数 (3)c系数(列联系数)。c系数也是一种与x2有关的相关系数,其计算公式为: 在采用C系数值时,要用“上限表”进行修正 C系数的突出优点:不受样本规模大小的影响。 (4)λ系数。 λ系数优于前述几种相关统计量的地方,是它具有消减误差比例(简称PRE)的意义。我们知道,社会调查的主要目标是解释或预测社会现象的变化,而这种预测中难免会有误差。对于两个有关系的变量来说,在我们知道变量x的值去预测与它相关的变量y的值时所存在的误差(E2),显然比我们不知道又的值去预测y的值时所存在的总误差(E1)要小。所谓消减误差比例,指的就是知道x的值来预测y值时所减少的误差(E1—E2)与总误差的比。用公式表示即是: PRE越大,表示以x值去预测Y值时能够减少的误差所占的比例越大,换句话说,X与Y之间就越是相关,或者说,x与y的关系越强。 λ系数的基本特点是以众值作为预测的准则。其计算公式为: 式中,?y表示变量x的每一个值之下变量y的众值,Fy表示变量y的边际分布中的众值。 λ系数的优点是具有PRE意义,但其缺点是仅利用众值资料。当表中的众值都集中在同一行时, λ系数就会等于零,比如表10—15。 在这种情况下,我们可采用Tau-y系数(简记为τy)来进行测量。Tau-y 系数属于不对称相关测量法,即要求x是自变量,y是因变量。它的数值也介 于0与1之间,同样具有消减误差比例的意义。其计算公式为: 三、其他层次变量的相关测量与检验 1、定序变量与定序变量 2、定类变量(或定序变量)与定距变量 3、定距变量与定距变量 1、定序变量与定序变量 如果两个变量都是定序变量,我们可以用古德曼和古鲁斯卡的Gamma系数来测量它们之间的关系。Gamma系数通常用G表示,其取值范围是[-1,+1],适用于分析对称关系,其计算公式是:

文档评论(0)

erfg4eg + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档