spss-第三章-SPSS数据预处理.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
按工资分组(元) 频数(人) 频率(%) 850以下 5 31.3 850-900 5 31.3 900-950 1 6.3 950-1000 2 12.5 1000以上 3 18.6 例如:职工基本情况数据,可按基本 工资对职工进行分组,见下表: SPSS单变量值分组的基本操作步骤: (1)选择菜单Transform-Automatic Recode (2)将分组变量选择到Variable-New Name框中 (3)在New Name框后输入存放分组结果的变量名,并单击Add New Name按钮 (4)在Recode Starting from框中选择单变量值分组按升序还是按降序进行。Lowest value表示升序;Highest value表示降序。 3.6.2 SPSS的单项式分组 单变量值分组应用举例: 1.按职工的职称升序进行分组。 (1) 组数和组距确定后,便可实施分组操作了,在分组操作时应: 指定分组变量 定义分组区间(注意遵循“不重不漏”原则) 指定存放结果的变量 (2)SPSS对分组结果有两种存放策略: ①用分组变量值覆盖原变量(Into Same Variables), ②将分组结果存到一个新变量中(Into Different Variables)。相应的操作也略有差异。通常采用第二种策略。 3.6.3 SPSS的组距式分组 说明: (1)完成数据选取后,以后的SPSS分析操作仅针对那些被选中的个案直到用户再次改变数据的选取为止。 (2)采用指定条件选取和随机抽样方法进行数据选取后,SPSS将在数据编辑窗口中自动生成一个名为filter_$的新变量,取值为1或0。1表示本个案被选中,0表示未被选中。该变量是SPSS产生的中间变量,如果删除它则自动取消样本抽样。 (1)选择菜单Data—Select cases (2)根据分析需要选择数据选取方法 (3)Unselected cases are指定对未选中个案的处理方式 Filtered表示在未被选中的个案号码上打一个“/”标记; Deleted表示将未被选中的个案从数据编辑窗口中删除。 3.3.2 数据选取的基本操作 Select Cases对话框 Filtered:未被选中的个案号码上打一个“\”标记 deleted:未被选中的个案删除 利用住房状况调查数据,根据不同的分析要求采用不同的数据选取方法抽样: (1)只希望分析本市户口的住房状况。 可以通过数据选择功能采用指定条件的抽样方法进行抽样; (2)只希望对其中的70%的数据进行分析。 可通过数据选择功能采用随机抽样中的近似抽样方法进行抽样。 3.3.4 数据选取的应用举例 进行极端值的处理,也要通过数据选取来完成,通常是把超过三个标准差之外的数据剔除掉。利用住房状况调查数据剔除家庭收入的极端值。 住房状况调查数据中计划面积的缺失值处理方法。 利用spss变量计算功能,随机生成服从标准正态分布的100个样本数据。 3.4 计数 3.4.1 计数目的 (1)SPSS实现的计数是对所有个案或满足某条件的部分个案,计算若干变量中有几个变量的值落在指定的区间内,并将计数结果存入一个新变量中的过程。 (2)例如对大学毕业班学生的成绩进行综合测评时,可以依次计算每个学生的若干门课程中有几门课程得了优,有几门课程得了良,有几门课程不及格。 (3) SPSS实现计数的关键步骤是: ①指定哪些变量参与计数,计数的结果存入哪个新变量中 ②指定计数区间(尤为关键) SPSS中的计数区间可以有以下几种描述形式: 单个变量值(Value) 系统缺失值(System-missing) 系统缺失值或用户缺失值( System or user-missing) 给定最大值和最小值的区间(n through m) 小于等于某指定值的区间(Lowest through n) 大于等于某指定值的区间(n through highest) 3.4.2 计数区间 (1)上述后三个计数区间很容易理解。 例如评价学生成绩,成绩为优的计数区间可以指定为90 through highest,成绩为良的计数区间指定为80 through 89,不及格的计数区间指定为Lowest through 59。 (2)前三个计数区间实际上是一些离散的数据点,严格讲并不是区间,但SPSS仍将其归在广义区间的范畴内,目的是方便一些其他的应用。 (1)选择菜单Transform-Count,出现如下窗口: 3.4.3 计数的基本操作 (2)将参与计数的变量选到 Variables框中 (3)在Target Variable框中输入存放计数结果的变量名,并

文档评论(0)

js1180 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档