SAS应用基础4-3 几个常用的服务过程.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS应用基础4-3 几个常用的服务过程

几个常用的服务过程 Sort √ √ Rank Standard Format√ Print √ √ Printto Tabulate Transpose √ Score* 这些SAS服务过程不直接给出统计值,但常用来准备或整理统计资料。 排序过程 SORT过程可将数据集的观测值按一个或多个变量值进行排序,以便其它的SAS过程利用BY语句对其进行分组处理。排序后的观测值存放在一个新的SAS数据集中或替代原数据集。 过程格式: PROC SORT [选项]; BY [DESCENDING] 变量1 […[DESCENDING] 变量n]; [RUN;] SORT过程的常用选项 PROC SORT语句的主要选项有: DATA=数据集名 指定要排序的数据集,若省略,则使用最近生成的数据集; OUT=数据集名 指定一个输出数据集,若省略,排序结果仍存在原数据集中; NODUPKEY 检查并删除具有相等排序变量值的较后观测值。 在BY语句中可使用DESCENDING选择项,使观测值按降序排列,缺省时为升序。 排秩过程 有些统计方法需要利用变量值的秩次,即看一个数值型变量的各值按其大小排在第几位。确定秩次的过程称为排秩。排秩与排序不同,它只针对数值变量,且不改变观测的顺序,排秩后产生新变量,存放原变量的秩次,输出到新数据集中。 格式: PROC RANK [选项]; [VAR 变量名表;] [RANKS 变量名表;] [BY 变量名;] [RUN;] RANK过程的主要语句选项 PROC RANK语句的主要选项有: DATA=数据集 要分析的数据集; OUT=输出数据集 指定秩次变量的输出数据集,缺省时,系统默认为DATAn; TIES=MEAN|HIGH|LOW 观测值相同时,按位次的平均数、最高位次、最低位次取秩; DESCENDING 从大到小方式排秩,即值最大的秩为1,值第2大的为2,等等。 排秩过程的注意事项 如果一个变量有几个观测的值相同,则它们的秩次也相同,此时SAS用选项TIES=来确定几种取秩方法(取平均秩、取高位秩、取低位秩)。 RANKS语句指定秩次变量名,必须与VAR语句中的原变量名相对应;缺省时,在输出数据集中用原变量名存放秩次。 排秩示例 生成一个数据集rtmp存放对数据集tmp中数值变量排秩后的数据。 data tmp; input x y@@; cards; 3 10 5 10 11 10 5 9 7 11 proc rank out=rtmp; proc print; run; 标准化过程 某些统计技术常要求把数据集标准化(z=(x-Ex)/s)后再进行分析,但SAS标准化过程STANDARD的含义更广泛,它实际上是一种线性变换:Z=a+bx,只要指定Z的期望m标准差std,它将自动选择a、b,通过原始数据x生成出合适的新变量Z的数据;而狭义的标准化只是STANDARD过程的一个特例,即m=0、std=1。 STANDARD过程的用法 PROC STANDARD [选项]; [VAR 变量表;] [FREQ 变量表;] [WEIGHT 变量表;] [BY 变量名;] [RUN;] STANDARD过程的常用选项 DATA=数据集 需标准化的数据集。(若缺省,则使用必威体育精装版建立的数据集) OUT=数据集 给含标准化变量的新数据集命名。(若缺省,以DATAn命名) MEAN=m 标准化后的变量均值为m。(若缺省,则输出均值与输入均值相同) STD=s 输出的变量标准差为s。(若缺省,则输出标准差与输入标准差相同) VARDEF=DF|N|WGT|WDF 该选项用于指定方差计算中分母的值:选DF表示分母是自由度N-1(此为默认项),选N表示分母是样本数N,选WGT表示分母为各观测值权重之和,选WDF表示分母是各观测值权重之后减一; REPLACE 该选项指定用均值代替缺失值。 STANDARD过程的示例 对数据集fitness的变量oxygen、runtime计算标准分,并存放在数据集tmp中。 proc standard mean=0 std=1 data=tmp.fitness out=tmp; var heart aero; proc print; run; PRINT过程 PRINT过程可将SAS数据集的观测值打印出来,可打印部分变量的值,也可打印数值变量的总和。过程格式: PROC

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档