第2章SPSS级统计分析操作介绍.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 SPSS高级统计分析操作介绍 在上一章中详细介绍了SPSS基本统计分析方法的界面操作和英文标签说明,包括数据描述性分析、均值检验、方差分析、相关回归分析、非参数检验、聚类和判别分析、主成分分析和因子分析等。在本章中,将详细介绍SPSS软件中所用到的高级统计分析方法,主要包括生存分析、信度分析以及常用统计图形的界面操作和英文标签说明。 2.1 生 存 分 析 生存分析方法是一种非常重要的统计分析方法,主要用于分析涉及一定时间的发生和持续长度的时间数据,用以揭示事件发生和发展的规律。生存分析是近一二十年来发展起来的数理统计新分支,它是根据现代医学、工程等科学研究的大量实际问题提出来的,着重对截断数据进行统计分析研究。生存分析的理论与应用受到了世界各国,特别是发达国家很大的重视。1986 年美国国家科学院委员会提出的数学发展概况中,曾把生存分析列为?6?大发展方向之一。 生存分析目前已广泛应用在医学、生物学、公共健康、金融学、保险、人口统计等诸多领域,它涉及数理统计中原有的参数统计与非参数统计的结合,而且涉及一些较深较新的概率和其他数学工具。因此,生存分析方法日益受到人们的重视。 本章介绍了如何使用SPSS来进行生存分析。SPSS所提供的功能主要有以下4项。 Life Tables:寿命表分析。 Kaplan-Meier:Kaplan-Meier分析。 Cox Regression:Cox回归分析。 Cox w/Time-Dep Cov:时间相依性的回归分析。 2.1.1 生存分析简介 生存分析(Survival Analysis)主要用于对涉及一定时间的发生和持续长度的时间数据的分析。生存分析所分析的数据通常称为生存数据,生存数据按照观察数据所提供的信息的不同,可以分为完全数据、删失数据和截尾数据3种。 生存分析(Survival Analysis)是目前统计学的热门,自20世纪70年代中期以来,得到了迅速的发展,无论在理论或应用方面都受到了人们的重视。生存分析不仅能妥善处理现实生活中常见的截尾数据(Censored Data)问题,而且在解决实际问题的同时,揭示了一些更为复杂的理论问题,促进了数理统计理论的发展。1986 年美国国家科学院委员会提出的数学发展概况的报告中,6个有代表性的分支学科中就有一个是论述生存分析的,而且被作为数学与其他学科,甚至社会科学互相渗透的一个重要例子。 生存分析所要分析的数据称为生存数据,用于度量某事件发生前所经历的时间长度。事件可以是产品的失效、保单的索赔、疾病的发生、生命的死亡等。若跟产品失效有关,生存数据也称为失效数据。 按照观察数据所提供的信息的不同,生存数据又可以分为以下三大类。 1.完全数据 完全数据指的就是提供了完整信息的数据,比如研究某种产品的失效时间,如果有一个样品从进入研究直到失效都在我们的观察之中,就可以得到其失效的具体时间,那么这个失效数据就是一个完全数据。 2.删失数据 生存分析经常研究在不同的时间点或时期被研究的事件发生的概率,而研究的周期可能很长,比如在医学领域,研究某种慢性疾病的治疗效果一般都要对患者进行长期随访,统计一定时期后的生存或死亡的情况以判断治疗效果,这种随访数据就是生存数据。但是,由于获得数据的时间很长,中间可能患者由于迁移、不愿意继续合作等各种原因退出了随访,或者研究单位由于人力、物力、财力等方面的原因在某个时刻决定中止随访,那么这些退出研究或者被终止研究的患者提供的信息就是不完整的信息,若他们在退出研究之时仍然存活,那么日后的确切死亡时间在数据中就无法反映。 完全数据和删失数据都是在生存分析中经常会碰到的数据,SPSS要求在进行生存分析时每个变量都必须再设置一个相应的示性函数,用以说明这个数据到底是完全数据还是删失数据。通常采用的示性函数的取值规则是:完全函数,示性函数取值为0;删失数据,示性函数取值为1。 3.截尾数据 截尾数据和删失数据一样,所提供的是不完整的数据,它和删失数据的不同在于,它提供的是跟时间有关的条件信息。比如保险公司想研究60岁以上的老年人投保了意外伤害险的人发生意外的概率,那么被研究的投保人在研究期内所提供的生存数据为截尾数据,因为它们都附带一个时间条件:进入研究的人的年龄都应该大于等于60岁。 不过SPSS软件只考虑对完整数据和删失数据的分析,对截尾数据不提供专门的分析方法。 2.1.2 寿命表分析 在生存分析中,对生存函数的估计是一个重要问题。寿命表方法是一种重要的非参数估计方法,它不仅有悠久的历史,而且在各领域都有广泛的应用。 在实际研究中,通常需要了解两个事件之间间隔的时间长短的分布。例如,如果正在研究治疗某种致命疾病的效果,可能要观察治疗实施到患者死亡这段时间的情况。得到评估结果的时候,若并非所有患者都死亡,则必

您可能关注的文档

文档评论(0)

189****8221 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档