下载此文档

Stata面板数据的统计分析.doc


文档分类:IT计算机 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
面板数据的统计分析( Stata ) 在写论文时经常碰见一些即是时间序列又是截面的数据,比如分析 1999-2010 的公司盈余管理影响因素,而影响盈余管理的因素有 6个,那么会形成如下图的数据公司 1公司 2公司 100 因素 1因素 6 盈余管理程度因素 1…因素 6 盈余管理程度因素 1因素 6 盈余管理程度 1999 2000 …… 2010 如上图所示的数据即为面板数据。显然面板数据是三维的,而时间序列数据和截面数据都是二维的,把面板数据当成时间序列数据或者截面数据来处理都是不合适的。处理面板数据的软件较多,一般使用 、 Stata 等。个人推荐使用 Stata , 因为 Stata 比较适合处理面板数据,且个性化强。以下以 为例来讲解怎么样处理面板数据。由于面板数据的存储结构与我们通常使用的存储结构不太一样,所在统计分析前,最好在 excel 中整理一下数据,形成如下图所示的数据年份公司名称因素 1因素 2……因素 6盈余管理程度 1999 公司 12000 公司 1……公司 12010 公司 11999 公司 22000 公司 2……公司 22010 公司 2 变量定义及输入数据启动 , Stata 界面有 4个组成部分, Review (在左上角)、 Variables (左下角)、输出窗口(在右上角)、 Command (右下角)。首先定义变量, 可以输入命令,也可以通过点击 Data----Create new Variable or change variable 。特别注意,这里要定义的变量除了因素 1、因素 2、……因素 6、盈余管理影响程度等,还要定义年份和公司名称两个变量,这两个变量的数据类型( Type ) 最好设置为 int (整型),公司名称不要使用中文名称或者字母等,用数字代替。定义好变量之后可以输入数据了。数据可以直接导入( File-Import ),也可以手工录入或者复制粘贴( Data-Data Edit(Browse) ),手工录入数据和在 excel 中的操作一样。以上面说的为例,定义变量 year 、 company 、 factor1 、 factor2 、 factor3 、 factor4 、 factor5 、 factor6 、 DA 。 pany 和 year 分别为截面变量和时间变量。显然,通过这两个变量我们可以非常清楚地确定 panel data 的数据存储格式。因此,在使用 STATA 估计模型之前,我们必须告诉它截面变量和时间变量分别是什么,所用的命令为 tsset , 命令为: pany year 输出窗口将输出相应结果。由于面板数据本身兼具截面数据和时间序列二者的特性,所以对时间序列进行操作的运算同样可以应用到面板数据身上。这一点在处理某些数据时显得非常方便。如,对于上述数据,我们想产生一个新的变量 Lag _factor1 ,也就是 factor1 的一阶滞后,那么我们可以采用如下命令: gen Lag_factor1= 差分变量: Gen fiscal(D)= 统计描述: 在正式进行模型的估计之前,我们必须对样本的基本分布特性有一个总体的了解。对于面板数据而言,我们至少要知道我们

Stata面板数据的统计分析 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人gumumeiying
  • 文件大小0 KB
  • 时间2016-03-27