数据文件的建立和管理.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据文件的建立和管理

第2次作业 本章作业的4~12题 将作业发送到spss_zuoye@126.com,并自行保存该文件,留待以后作业用。 邮件名称为“姓名(第二次作业)”,例如“孙伟(第二次作业)” 邮件有发送时间,以本次课的时间为准。 1.3.5 数据的转置 SPSS可以将数据编辑器中打开的数据实现行列转换。 操作过程为:选择【数据】→【转置】,将原来的数据文件进行行列转置,转置后将生成一个新的数据文件 数据转置时需注意以下几点: (1)原文件的行变成新文件的列,原文件的列变成新文件的行。 (2)原文件中未被选择的变量将在新文件中遗漏。 (3)原文件中各列顶部的变量名称被转到新文件中的第一列,并成为CASE_LBL中的数据。 (4)原文件中的字符型变量和日期型变量将变为数值型变量。 (5)在新文件中,SPSS将依据选择的“名称变量”自动为变量命名。 1.3.6 变量重赋值 变量重赋值也可称为变量分组,处理的对象主要是尺度变量(另外两种用的比较少),依据一定的规则,将尺度变量进行分组重新赋值,形成一个新的顺序尺度变量,再基于此进行其他数据分析 例题:将数据2-1.sav进行分组,要求按年龄段分组,其中30岁以下为第1组,30~40岁为第2组,40~50为第3组,50岁以上为第4组。 步骤:打开数据文件2-1.sav 选择【转换】-【重新编码为不同变量】 将变量age通过箭头选入重赋值变量框中,将右边输出变量框下名称中输入ageint,标签为“投保人年龄段”,点击【更改】 单击【旧值和新值】,在对话框右边【值】框中填写1,左边选择从无穷小到29,单击【添加】…..,最后【确定】 定义ageint的变量结构,调整 “值”和变量结构。 1.3.7 数据的分类汇总 当全部记录分为不同组别时,可对每组记录的各数值求取指定的描述统计量。 操作过程为:选择【数据】→【分类汇总】, 其结果将存入一个新的文件 例题2: 利用车险投保交通事故数据2-1,根据性别和年龄段,对交通事故数进行分类汇总并计算每类的均值。 按性别分类汇总:选择【数据】→【分类汇总】,将性别选入“分组变量框”,将交通事故数选入“汇总变量框”,单击【函数】进入下一步,选择均值,单击【继续】返回,可以点击【变量名标签】为汇总变量加变量名标签,若勾选【个案数】,则会在结果中汇总分类数据的总数 对话框下半部分选择文件储存方式,共三种,不推荐第一种,可以选择后两种。 第一种存储方式,将汇总变量加入当前数据集,会导致汇总后的数据结果和当前大不相同,甚至会出现错误,所以不推荐使用。 第二种存储方式,汇总结果保存在新形成的数据文件中,需要给新形成的数据文件命名,这个数据文件是打开的。本题选择这一项,并命名为agg1 第三种存储方式和第二种相似,不同的是新形成的数据文件是关闭的,需要另行打开。 结果分析:从新生成的文件agg1,可以看出平均交通事故次数男性1.98大于女性1.47 按年龄段汇总数据的做法和刚才按性别汇总的操作类似,将性别变量换为年龄段变量,其他相同,学生自己实验。 1.3.8 根据已有变量建立新变量 在进行数据的分析处理时,往往需要根据已经存在的变量建立新变量,这一项工作可以直接通过SPSS 的“计算变量”功能得以实现。 操作:选择【转换】 →【计算变量】,在对话框中输入目标变量的名称及数学表达式,即可求取新变量 例题3:数据2-2记录了某银行客户的家庭收入负债数据,请基于此数据计算储户的信用得分,假设信用得分=净收入+工作年限*3+居住年限-是否违约*30 步骤1:打开数据文件2-2.sav 步骤2:选择【转换】-【计算变量】 步骤:3:完成变量相关设置 输入目标【变量名称】,并为其添加【标签与类型】,在利用函数表达式计算目标变量。 1.3.9 数据的计数 计算若干变量中有那几个变量的值落在指定区间内。 例题:数据2-2中对年龄、受教育程度、收入违约情况进行计数,年龄计数的区间是35~45,受教育程度的计数区间是大专以上,收入的计数区间是100以上,违约情况的计数区间是无违约。 操作: 打开数据文件2-2,选择【转换】-【对个案中的值计数】 建立计数结果变量“countnumber”,标签为“计数结果变量” 分别将年龄、教育水平、家庭收入、是否曾经违约四个变量选入计数变量框。 单击【定义值】,指定计数期间 由于“年龄”变量取值为35~45,因此计数区间为第4种类型,在两个框中填写35、45,单击“添加”按钮,就将计数区间指定好了;同理,可以指定“受教育程度”的计数区间为第4种类型的3到5,选定“收入”的计数区间为第6种,100到无穷,指定“是否违约”为第1种类型,取值为0。 【注意】要保证计数期间是互不相交的,因为SPSS在计数时,对于每个变量都要依次检验是否满足指定的计数

文档评论(0)

zhuliyan1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档