- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS连接数据集
SAS连接数据集 可以使⽤SET语句连接多个SAS数据集以提供单个数据集。 在连接的数据集中的观察 的总数是原始数据集中的观察的数量的总和。 观察的顺序是连续的。 ⾃第⼀数据 集的所有观察结果后⾯是 ⾃第⼆数据集的所有观察结果,并依此类推。 所有组合数据集具有相同的变量,但是如果它们具有不同数量的变量,则在结果中出 现所有变量,对于较⼩数据集具有缺失值。 句法 SAS 中SET语句的基本语法是: SET data-set 1 data-set 2 data-set 3; 以下是所使⽤的参数的说明: data-set 1,data-set2是⼀个接⼀个写⼊的数据集名称。 例 考虑在两个不同数据集中可⽤的组织的员⼯数据,⼀个⽤于IT部门,另⼀个⽤于⾮IT 部门。 要获得所有员⼯的完整详细信息,我们使⽤如下所⽰的SET语句连接两个数据 集。 DATA ITDEPT; INPUT empid name $ salary ; DATALINES; 1 Ri k 623.3 3 Mike 611.5 6 Tusar 578.6 ; RUN; DATA NON_ITDEPT; INPUT empid name $ salary ; DATALINES; 2 Dan 515.2 4 Ryan 729.1 5 Gary 843.25 7 Pranab 632.8 8 Rasmi 722.5 RUN; DATA All_Dept; SET ITDEPT NON_ITDEPT; RUN; PROC PRINT DATA=All_Dept; RUN; 当执⾏上⾯的代码,我们可以得到下⾯的输出。 ⽅案 当我们在⽤于级联的数据集中有许多变化时,变量的结果可以不同,但是级联数据集 中的观测值的总数总是每个数据集中的观测值的总和。 我们将在下⾯考虑这种变化的 许多情况。 不同数量的变量 如果原始数据集中的⼀个具有更多数量的变量⽽另⼀个数据集,则数据集仍然被组 合,但是在较⼩的数据集中,这些变量显⽰为缺失。 例 在下⾯的例⼦中,第⼀个数据集有⼀个名为DOJ 的额外变量。 在结果中,第⼆个数据 集的DOJ值将显⽰为缺失。 DATA ITDEPT; INPUT empid name $ salary DOJ date9. ; DATALINES; 1 Ri k 623.3 02APR2001 3 Mike 611.5 21OCT2000 6 Tusar 578.6 01MAR2009 ; RUN; DATA NON_ITDEPT; INPUT empid name $ salary ; DATALINES; 2 Dan 515.2 4 Ryan 729.1 5 Gary 843.25 7 Pranab 632.8 8 Rasmi 722.5 RUN; DATA All_Dept; SET ITDEPT NON_ITDEPT; RUN; PROC PRINT DATA=All_Dept; RUN; 当执⾏上⾯的代码,我们可以得到下⾯的输出。 不同的变量名 在这种情况下,数据集具有相同数量的变量,但变量名在它们之间不同。 在这种情况 下,正态连接将产⽣结果集中的所有变量,并给出不同的两个变量的缺失结果。 虽然 我们不能更改原始数据集中的变量名称,但我们可以在我们创建的连接数据集中应 ⽤RENAME函数。 这将产⽣与正常连接相同的结果,但是当然使⽤⼀个新的变量名 称代替原始数据集中存在的两个不同的变量名称。 例 在下⾯的⽰例中,数据集ITDEPT具有变量名ename ,⽽数据集NON_ITDEPT具有变量 名empame 。 但这两个变量代表相同的类型 (字符)。 我们在SET语句中应 ⽤RENAME函数,如下所⽰。 DATA ITDEPT; INPUT empid ename $ salary ; DATALINES; 1 Ri k 623.3 3 Mike 611.5 6 Tusar 578.6 ; RUN; DATA NON_ITDEPT; INPUT empid empname $ salary ; DATALINES; 2 Dan 515.2 4 Ryan 729.1
您可能关注的文档
最近下载
- 船舶自动识别系统(AIS)术语.pdf VIP
- 2025年湖南湘江新区招聘事业单位工作人员77人笔试备考题库及答案解析.docx VIP
- 2025年湖南湘江新区招聘事业单位工作人员77人笔试参考题库附答案解析.docx VIP
- 【抗战胜利80周年】纪念中国人民抗日战争暨世界反法西斯战争胜利80周年.pptx VIP
- 我理想的大学--武汉大学.ppt
- 2025年湖南湘江新区招聘事业单位工作人员77人备考练习试题及答案解析.docx VIP
- 2025湖南长沙市湘江新区招聘事业单位工作人员77人考试备考题库及答案解析.docx VIP
- 五年级数学人工智能AI赋能国家中小学智慧教育平台应用案例.docx
- 2025年湖南湘江新区招聘事业单位工作人员77人考试备考题库及答案解析.docx VIP
- 中建XXX局各类建筑工程技术经济指标(含计算公式).pdf VIP
文档评论(0)