- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
STATA数据处理
实证论文的数据结构
查找命令与帮助
数据下载
数据导入和输出
数据合并
数据描述和画图
数据 理
命名与标注
表达式
生成新的变量
gen and egen
删除变量或者观测值
生成排序后变量和滞后项
时间序列
基于类别变量生成虚拟变量
因子变量
基于连续变量生成类别变量
重复值
outliers
数据转置与行列变换
文字变量的处理
判断文字是否匹配
单值与暂元
单值(scalar)
暂元
全局暂元
循环语句
forvalues 语句
foreach 语句
回归结果导出
STATA数据处理
实证论文的数据结构
一个实证论文 ,前面一般会有三四个表格来描述样本选择过程、样本特征、单变量检验和相关性
分析。然后是几个包含回归结果的表格 ,这是一篇实证论文贡献最大的地方所在。结果部分一般
包含主要回归结果 ,稳健性检验和排除其他解释的回归表格。
查找命令与帮助
help 命令 :在stata中查找某命令的帮助文件 ;search 命令 :searches the [keywords] of
the help files ;findit 命令 :类似 search 命令 ,但可以进一步有哪些信誉好的足球投注网站网络上的信息。
数据下载
数据下载成-tab-分割的csv格式最容易导入stata。大数据可以下载成dbf格式 ,然后用
Stat/T ransfer转成dta格式导入最方便。
数据导入和输出
在导入之前 ,可以在stata中先查看数据的情况 :shellout 是直接从stata中打开某个文
件 ,type 是在stata窗口中打印出数据。
shellout d.csv
如果是以-tab-分割的格式 ,可以用insheet 导入。如果是dta格式 ,直接 use 就可以。
insheet using d.csv, clear
如果是逗号分隔的数据 ,也可以用insheet 导入 ,但需要说明分割符号 :
insheet using d.txt, delimiter(,) clear
存成stata格式文件用 save ;导出成e cel可用数据用outsheet :
save filename, replace
outsheet using d.csv, comma replace
查看已导入的数据用list 或者browse :
list price in 1/10
数据合并
如果是合并相同观测值的不同变量 ,用merge ;
merge 1 1 id using d2, replace
merge 1 m id using d2, replace
如果是合并不同观测值的相同变量 ,用append ;如果是想交叉合并 ,给joinby 。
append using d2, replace
joinby year industry using d2
数据描述和画图
查看数据集的变量属性 ,用describe ;描述变量的分布
用 summarize ,codebook 和 inspect :
desc make price
sum price, detail
更改变量排列顺序用order :
order price weight length foreign
对观测值进行排序用 sort 或者gsort :
sysuse nlsw88.dta, clear
sort wage // 默认为升序排列
gsort -wage // 降序排列
gsort wa
文档评论(0)