下载此文档

大数据理论与实务-第八讲 离散选择模型-对外经济贸易大学大数据理论与统计使用对外经济贸易大学.ppt


文档分类:高等教育 | 页数:约33页 举报非法文档有奖
1/33
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/33 下载此文档
文档列表 文档介绍
第八讲离散被解释变量模型主要内容1-二值选择模型2-多值选择模型第1节二值选择模烈一实验基本原理1二值选择馍型假设研究人仃买房的问题时,人们有两种选择;y(买房减者y=0(不买),然而是否房玟决于人们的收λ,对房价的基本预期,结娪与酉等影响因素。假把这些国素作为解雫变量:y4=x1+1(=1…,n)(这里y是不可观测的潜变量由此模型得到的y估计仨可能会出现大于1或者小亍0的不合实际的情况,为了使估章值在[1范肉,考虑y的两点分布函数p=03F(通过选合的F函鼓形式(随机变昰的积分布函数)来保证0≤y≤1。由于E(yx)=1*P=1x)+0·P=01)=p=1x),所以以理解为“y=1”的概率。若F为标准正态分布函数,那么有下面的等式立,此模型剜是probit模型:艹P(y=1Lx)=F(xB)=o(xB)=MoC)dtw若F为“逻辑分和¨分術函数,那么下面的等式就是1t橫型P(y=1x)=F(xB)=A(xp)=-x73+由于逻辑分布的累积分布函数有解析表达式,而标准正态分布没有,所以國ogt模型的算相比pobt摸型简单。以Jogt为例,通过下面的变形整理lo模型可以整理得到以下等式,nfy:x;:6)=ynA(x8)+(1-y)ln[1-A(x)1InL(Sly,x)=>yIn[A(xB)]+>(1-ym(1-A(xB)=1使用Sn未最大化此丰线性函数就可以求的模型的相关估计量。相冋的样本使用l模型和probit模型估计出的参数佶计值吏于两模型假定的分布数不同,两个参数估计值是不可比的。对此Amemia提出,同一个样本的1gt模型与probit模摸型的参数估计值大概有如下关系:gt≈1,6*Fpre另外可以使用S计算两个模型的边际效应,然后进行比较。注意,在这个非线性模型估计中,Bc并不表示边际效应,只是表示解释变量影响的方向。42二值选择模型的异方差问题由于标谁的pobt模型或者!g模型的扰动项是服从同方差偎设的,但是很多回归模是存在异方的。这时可以使用sta讲行“似比检盟”(LR)来检测是方差的存在。以probit模型为,“同方差”原慢设H为Pv:=1x)=oxB/0,此时=1,而异方差的替代假设H为P(v1=1x1)=φ(x'B),其中G1≡VAR(E1)IR检验的结果煮接受原偎,则低用同方差probit模型,若拒绝则使用异方差probit模型。二实验内容和数据来源根据某统计资料,得到美国妇女就业的数据统计集,形成数据文件“”,用来研究影响美国妇女就业的因素。被解释变量是work(就业work=1,不就业wok=0),解释变量是age(年龄),married(婚否),children(子女数),education(教育年限)。完整的数据在本书附带光盘里的data文件夹的“womenwork,dta工作文件中■利用以上数据,建立合适模型对就业的影响因素进行计量分析,由于被解释变量取值有两个可以建立二值选择模型来分析问题。三实验操作指导1建立l。g模型分析(1)使用og模型回归Stata中使用loq模型回归的命令语句格式如下:logityx1x2…[i[in][weigh][。ptions]该命令中logt表示使用logt模型进行回归,相应y表示模型的被解释变量,x表示模型的解释变量,ⅱ表示logj的回归条件,in表示回归的范围,weight表示给观测值的加入权重,opons的内容如下表所示fset(amg)约束ym的系数为1clusterclustvar,bootstrap,或者jackknifeReporting,识置置信度:默认值是954输出机会比maxmizeopdo不输出系数表格栏:很少用本实验中,在Stata命令窗口中输入如下命令。usewomenworkclear输入此命令来打开需要的数据文件。logitworkageeducationmarriedchildren输入此命令对被解释变量为Work,解释变量为age、education、married、children的模型使用logt模型进行回归佔计。在这个回归结果图中Tloglikelihood即对数似然值,不断的试错迭代是g模型的估计方法,在逐步进行回归时,通过比较模型的-2LL判游模型的拟合优度,选择取值更小的模型。LRch2(4)是卡方检验的统计量,也就是回归模型无效假设所对应的似然比检验量;其中4为自由度,Prob>chi2是其对应的P值,在这个估计结果显示以p=0显著说明模型的有效性。其实这两个指标与线性回归结果中F统ˉ和P值的功能是大体一致的。另外的PseudoR2是准R2,虽然不等亍R2,但可以用来检验模型对变量的解释力,因为二值选择模型是非线性模型,无法进行平方和分解,所以没有,但是准衡量的是对数似然函数的实际增加

大数据理论与实务-第八讲 离散选择模型-对外经济贸易大学大数据理论与统计使用对外经济贸易大学 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数33
  • 收藏数0 收藏
  • 顶次数0
  • 上传人PAN
  • 文件大小3.82 MB
  • 时间2020-11-03