第二章 Stata 中的数据处理.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主要内容: 1.数据的类型、压缩与转化 2.数据的导入 3.数据的整理 2.1数据的类型、压缩与转化 2.1.1打开本地或网络数据文件 Stata一般识别的数据文件的后缀名为.dta,打开这些数 据文件的命令为use命令,首先讲解一下use命令的基 本语句,具体格式如下: use [varlist] [if] [in] using filename [, clear nolabel] 这个命令中,use是打开数据的命令语句,varlist代表 变量名称,if是条件语句,in是范围语句,using filename代表数据文件路径。下面将详细介绍常用的五 种情形,所使用到的数据文件名称为usaauto.dta ,是根 据统计资料得到的美国汽车产业的横截面数据(1978 年) ,完整的数据在本书附带光盘的data文件夹的 “usaauto.dta”工作文件中。 2.1数据的类型、压缩与转化  (1)打开数据文件中的全部数据  如果想要打开usaauto数据文件中的全部数据,输入的标准命令 如下:  use “C:\data\usaauto.dta”  use是代表打开的命令语句,引号中“C:\data\usaauto.dta”则给出 了数据文件的路径,说明数据文件是C盘中data文件夹下的 usaauto.dta数据文件。  (2 )打开数据文件中的部分变量  有时,并不需要将数据文件中的所有变量全部打开,因为原始 数据内容丰富,含有很多变量,而研究可能只涉及其中的几个 变量。所以若只打开usaauto文件中的make和price这两个变量, 应该使用如下命令:  use make price using “C:\data\usaauto.dta”  这个命令中use make price部分表示需要打开make和price两个变 量,using “C:\data\usaauto.dta”部分表示打开的数据文件路径及 名称,如果用户使用此命令打开其他数据文件,所应用的命令 相似,只需要把表示文件名称和变量的具体内容修改即可。 2.1数据的类型、压缩与转化  (3 )打开数据文件中的部分样本 有时,原始数据文件的样本数量过于庞大,例如人口 普查的数据动辄千百万,可是一般的研究大部分不需 要全部的样本,只需要部分样本即可,所以这时候只 需要打开部分样本。例如,只需要打开usaauto数据文 件中第五到第十个样本的数据,可以使用如下命令: use “C:\data\usaauto.dta” in 5\10 其中use“C:\data\usaauto.dta”部分表示打开的数据文件 名称及路径,in5\10部分表示选取的样本序号,即选 取第5到第10个样本。如果用户使用此命令打开其他数 据文件,所应用的命令相似,只需要把表示文件名称 和样本序号的具体内容修改即可。 2.1数据的类型、压缩与转化  (4 )打开数据文件中具有某些特征的样本  有时,原始数据将不同特征的样本混杂在一起,而现实的研究却要求将 不同的样本分开研究,例如分别研究男性、女性的情况,城市、农村的 经济问题,等等。这时就需要只打开具有这些特征的样本数据进行分 析,在这个试验中,打开usaauto文件中进口车样本数据的命令为:  use “C:\data\usaauto.dta” if foreign==1  这个命令语句中最重要的就是if语句,该命令执行的结果就是让stata仅 仅读入符合条件的样本数据。在本例中,foreign==1就表示是进口车, 所以打开的数据就是进口车的数据。  (5 )打开网络数据  如果想使用Stata官方网站或其他网站所提供的数据,而这些数据又没有 直接下载到本地电脑上,Stata也有专门的命令供用户使用,以便打开这 种途径得到的数据。例如nlswork是Stata官方网站提供的有关美国年轻 女性年龄工资等的数据,要想通过网络打开,可以运行如下命令:  use http:\\\data\r9\nlswork 2.1数据的类型、压缩与转化 2.1.2Stata常用数据类型与压缩 Stata常用的数据类型主要有三类:即数值型、字符型 和日期型,下面将会逐一进行介绍。

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档