《SAS》数据步课件参考.ppt

  1. 1、本文档共144页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《SAS》数据步课件参考

SAS 数据集的建立与保存 把原始数据转化为SAS 数据 从数据区读入原始数据 data SAS数据集名; input @[n] SAS变量名 输入格式 行保持符号; cards; 数据区 ; run; * data 语句----标志数据步的开始及 命名将要创建的SAS数据集 INPUT语句----向系统表明如何读入每一条记录 cards语句----用于直接输入数据,标志着数据块的开始 run 语句----程序结束语句,表明该数据步程序结束 行保持符号是“@”或“@@”或缺省 * 从外部文本文件读入原始数据 data SAS数据集名; infile ‘计算机目录\原始数据文本文件名’; input SAS变量名 输入格式 行保持符号; run; infile 语句,说明原始数据是从一个文本文件里读取。infile d:\ qxx \ qxx1.dat; * 三种原始数据的排列方式 有空格式 每一行排列一个样本的全部变量的观察值,数值之间有空格,缺省数据(missing value)用小数点代表。每个变量的全部样本观察值所占的列数可以相等,也可以不相等 12 f 1.25 13 m 1.35 11 m 1.11 16 f 1.42 f . 对应的input 语句: input age sex $ height birthday yymmdd8. ; * 无空格式 每一行排列一个样本的全部变量的观察值,数值之间无空格,缺省数据空格,每个变量的全部样本观察值(包括缺省)所占的列数必须相等。 12 f 1.2519801202 13m1.3519791012 11m1.1119811111 16 f 1.4219760430 13 f 对应的input 语句: input @3 age 2. sex $1. height 4.2 birthday yymmdd8. ; 或input age 3-4 sex $5. height 6-9 birthday yymmdd8.; * 自由格式 每一行可以排列任意多个观察值,每个数值之间有空格,缺省数据用小数点代表。 12 f 1.25 13 m 1.35 11 m 1.11 16 f 1.42 13 f . 对应的input 语句: input age sex $ height birthday yymmdd 8. @@; * 双@@符和单@符号的区别 双@@符号表示读取完一个input语句中所有变量对应的一组观察值后不换行,连续读取所有变量对应的另一组观察值,直到全部数据读完为止。 单@符号表示读取完第一个input语句中所有变量对应的观察值后不换行,接着读取下一个input语句中所有变量对应的观察值,直到完成一个数据步中的所有input语句后再换行读取下一列的数据。 行保持符号缺省表示读取完一个input语句中所有变量对应的观察值后就换行读取下一行数据。 当一个数据步仅含有一个input语句时,行保持符号缺省和单@符号起的作用相同 * 文本文件test1.dat,,test2.dat 和test3.dat 保存在d:\ test子目录中 data d1; infile d:\test\test1.dat; input age sex $ height birthday yymmdd8. ;run ; data d2; infile d:\test\test2.dat missover; input age 2. sex $1. height 4.2 birthday yymmdd8. ;run; data d3; infile d:\test\test3.dat; input age sex $ height birthday yymmdd8. ; run; * 三种不同原始数据排列方式的特性 有空格式(非格式化输入法) 查看原始数据方便,清晰;读取数值方便,不必查看变量所占的列域,只需了解变量的排列顺序和类型。 自由式(非格式化输入法): 当变量少,样本多时,用此法可缩短数据区

您可能关注的文档

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档