面板数据的统计分析(Stata)
在写论文时经常碰见一些即是时间序列又是截面的数据,比如分析1999-2010的公司盈余管理影响因素,而影响盈余管理的因素有6个,那么会形成如下图的数据
公司1
公司2
公司100
因素1
因素6
盈余管理程度
因素1
…
因素6
盈余管理程度
因素1
因素6
盈余管理程度
1999
2000
……
2010
如上图所示的数据即为面板数据。显然面板数据是三维的,而时间序列数据和截面数据都是二维的,把面板数据当成时间序列数据或者截面数据来处理都是不合适的。
处理面板数据的软件较多,、Stata等。个人推荐使用Stata,因为Stata比较适合处理面板数据,且个性化强。。
由于面板数据的存储结构与我们通常使用的存储结构不太一样,所在统计分析前,最好在excel中整理一下数据,形成如下图所示的数据
年份
公司名称
因素1
因素2
……
因素6
盈余管理程度
1999
公司1
2000
公司1
……
公司1
2010
公司1
1999
公司2
2000
公司2
……
公司2
2010
公司2
变量定义及输入数据
,Stata界面有4个组成部分,Review(在左上角)、Variables(左下角)、输出窗口(在右上角)、Command(右下角)。首先定义变量,可以输入命令,也可以通过点击Data----Create new Variable or change variable。
特别注意,这里要定义的变量除了因素1、因素2、……因素6、盈余管理影响程度等,还要定义年份和公司名称两个变量,这两个变量的数据类型(Type)最好设置为int(整型),公司名称不要使用中文名称或者字母等,用数字代替。定义好变量之后可以输入数据了。数据可以直接导入(File-Import),也可以手工录入或者复制粘贴(Data-Data Edit(Browse)),手工录入数据和在excel中的操作一样。
以上面说的为例,定义变量 year、 company、 factor1、 factor2、 factor3、 factor4、 factor5、 factor6、 DA。
pany 和year分别为截面变量和时间变量。显然,通过这两个变量我们可以非常清楚地确定panel data 的数据存储格式。因此,在使用STATA 估计模型之前,我们必须告诉它截面变量和时间变
Stata面板数据的统计分析 来自淘豆网www.taodocs.com转载请标明出处.