下载此文档

Stata面板数据的统计分析.doc


文档分类:IT计算机 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
Stata面板数据的统计分析.doc面板数据的统计分析(Stata)在写论文时经常碰见一些即是时间序列又是截面的数据,比如分析1999-2010的公司盈余管理影响因素,而影响盈余管理的因素有6个,那么会形成如下图的数据公司1公司2公司100因素1因素6盈余管理程度因素1•••因素6盈余管理程度因素1因素6盈余管理程度199920002010如上图所示的数据即为面板数据。显然面板数据是三维的,而时间序列数据和截面数据都是二维的,把面板数据/成时间序列数据或者截面数据来处理都是不合适的。处理面板数据的软件较多,>Stata等。个人推荐使用Stata,因为Stata比较适合处理面板数据,且个性化强。。由于面板数据的存储结构与我们通常使用的存储结构不太一样,所在统计分析前,最好在excel>|•整理一-下数据,,Stata界面有4个组成部分,Review(在左上角)、Variables(左下角)、输出窗口(在右上角)、Command(右下角)。首先定义变量,可以输入命令,也可以通过点击Data——CreatenewVariableorchangevariableo特别注意,这里要定义的变量除了因素1、因素2 因素6、盈余管理影响程度等,还要定义年份和公司名称两个变量,这两个变量的数据类型(Type)最好设置为int(整型),公司名称不要使用中文名称或者字•母等,用数字代替。定义好变量之后可以输入数据了。数据可以直接导入(),也可以手工录入或者复制粘贴(Data・DataEdit(Browse)),手工录入数据和在excel111的操作一样。以上面说的为例,pany>factor1>factor2>factor3>fhctor4、factor5>factor6>DA。pany和year分别为截面变量和时间变量。显然,通过这两个变量我们可以非常清楚地确定paneldata的数据存储格式。因此,在使用STATA估计模型之前,我们必须告诉它截面变量和时间变量分别是什么,所用的命令为tsset,命令为:panyyear输出窗口将输出相应结果。由于面板数据本身兼具截面数据和时间序列二者的特性,所以对时间序列进行操作的运算同样可以应用到面板数据身上。这一点在处理某些数据时显得非常方便。如,对于上述数据,我们想产生一个新的变量Lagfactor1,也就是factor1的一阶滞后,那么我们可以采用如下命令:genLag_factorl=:Genfiscal(D)=:在正式进行模型的估计之前,我们必须对样本的基本分布特性有一个总体的了解。对于面板数据而言,我们至少要知道我们的数据中有多少个截面(个体),每个截面上有多少个观察期间,整个数据结构是平行的还是非平行的。进一步地,我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成:xtdes命令用于初步了解数据的大体分布状况,我们可•以知道数据中含有多少个截面,最大和最小的时间跨度是多

Stata面板数据的统计分析 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人ttteee8
  • 文件大小85 KB
  • 时间2020-06-12