下载此文档

大数据理论与实务-第八讲离散选择模型-对外经济贸易大学大数据理论与统计使用对外经济贸易大学.ppt

文档分类：高等教育 | 页数：约33页举报非法文档有奖

1/33

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/33 下载此文档

文档列表 文档介绍

第八讲离散被解释变量模型主要内容1-二值选择模型2-多值选择模型第1节二值选择模烈一实验基本原理1二值选择馍型假设研究人仃买房的问题时,人们有两种选择;y(买房减者y=0(不买),然而是否房玟决于人们的收λ,对房价的基本预期,结娪与酉等影响因素。假把这些国素作为解雫变量:y4=x1+1(=1…,n)(这里y是不可观测的潜变量由此模型得到的y估计仨可能会出现大于1或者小亍0的不合实际的情况,为了使估章值在[1范肉,考虑y的两点分布函数p=03F(通过选合的F函鼓形式(随机变昰的积分布函数)来保证0≤y≤1。由于E(yx)=1*P=1x)+0·P=01)=p=1x),所以以理解为“y=1”的概率。若F为标准正态分布函数,那么有下面的等式立,此模型剜是probit模型:艹P(y=1Lx)=F(xB)=o(xB)=MoC)dtw若F为“逻辑分和¨分術函数,那么下面的等式就是1t橫型P(y=1x)=F(xB)=A(xp)=-x73+由于逻辑分布的累积分布函数有解析表达式,而标准正态分布没有,所以國ogt模型的算相比pobt摸型简单。以Jogt为例,通过下面的变形整理lo模型可以整理得到以下等式,nfy:x;:6)=ynA(x8)+(1-y)ln[1-A(x)1InL(Sly,x)=>yIn[A(xB)]+>(1-ym(1-A(xB)=1使用Sn未最大化此丰线性函数就可以求的模型的相关估计量。相冋的样本使用l模型和probit模型估计出的参数佶计值吏于两模型假定的分布数不同,两个参数估计值是不可比的。对此Amemia提出,同一个样本的1gt模型与probit模摸型的参数估计值大概有如下关系:gt≈1,6*Fpre另外可以使用S计算两个模型的边际效应,然后进行比较。注意,在这个非线性模型估计中,Bc并不表示边际效应,只是表示解释变量影响的方向。42二值选择模型的异方差问题由于标谁的pobt模型或者!g模型的扰动项是服从同方差偎设的,但是很多回归模是存在异方的。这时可以使用sta讲行“似比检盟”(LR)来检测是方差的存在。以probit模型为,“同方差”原慢设H为Pv:=1x)=oxB/0,此时=1,而异方差的替代假设H为P(v1=1x1)=φ(x'B),其中G1≡VAR(E1)IR检验的结果煮接受原偎,则低用同方差probit模型,若拒绝则使用异方差probit模型。二实验内容和数据来源根据某统计资料,得到美国妇女就业的数据统计集,形成数据文件“”,用来研究影响美国妇女就业的因素。被解释变量是work(就业work=1,不就业wok=0),解释变量是age(年龄),married(婚否),children(子女数),education(教育年限)。完整的数据在本书附带光盘里的data文件夹的“womenwork,dta工作文件中■利用以上数据,建立合适模型对就业的影响因素进行计量分析,由于被解释变量取值有两个可以建立二值选择模型来分析问题。三实验操作指导1建立l。g模型分析(1)使用og模型回归Stata中使用loq模型回归的命令语句格式如下:logityx1x2…[i[in][weigh][。ptions]该命令中logt表示使用logt模型进行回归,相应y表示模型的被解释变量,x表示模型的解释变量,ⅱ表示logj的回归条件,in表示回归的范围,weight表示给观测值的加入权重,opons的内容如下表所示fset(amg)约束ym的系数为1clusterclustvar,bootstrap,或者jackknifeReporting,识置置信度:默认值是954输出机会比maxmizeopdo不输出系数表格栏:很少用本实验中,在Stata命令窗口中输入如下命令。usewomenworkclear输入此命令来打开需要的数据文件。logitworkageeducationmarriedchildren输入此命令对被解释变量为Work,解释变量为age、education、married、children的模型使用logt模型进行回归佔计。在这个回归结果图中Tloglikelihood即对数似然值,不断的试错迭代是g模型的估计方法,在逐步进行回归时,通过比较模型的-2LL判游模型的拟合优度,选择取值更小的模型。LRch2(4)是卡方检验的统计量,也就是回归模型无效假设所对应的似然比检验量;其中4为自由度,Prob>chi2是其对应的P值,在这个估计结果显示以p=0显著说明模型的有效性。其实这两个指标与线性回归结果中F统ˉ和P值的功能是大体一致的。另外的PseudoR2是准R2,虽然不等亍R2,但可以用来检验模型对变量的解释力,因为二值选择模型是非线性模型,无法进行平方和分解,所以没有,但是准衡量的是对数似然函数的实际增加

大数据理论与实务-第八讲离散选择模型-对外经济贸易大学大数据理论与统计使用对外经济贸易大学来自淘豆网www.taodocs.com转载请标明出处.

大数据理论与实务-第八讲离散选择模型-对外经济贸易大学大数据理论与统计使用对外经济贸易大学.ppt

数据库系统教学大纲对外经济贸易大学

大数据理论与实务-第八讲离散选择模型-对外经济贸易大学大数据理论与统计使用对外经济贸易大学

对-外-经-济-贸-易-大-学---对外经济贸易大学

据对外经济贸易大学研究生院消息年对外经济贸易大学

《货物贸易理论与实务》对外经济贸易大学文献

对外经贸理论与实务-对外经济贸易

【对外经济贸易大学专业】对外经济贸易大学招生网站-对外经济贸易大学分数线

数据库设计 - 对外经济贸易大学

数据库设计 - 对外经济贸易大学

数据库设计 - 对外经济贸易大学

大数据理论与实务-第八讲 离散选择模型-对外经济贸易大学大数据理论与统计使用对外经济贸易大学.ppt

大数据理论与实务-第八讲离散选择模型-对外经济贸易大学大数据理论与统计使用对外经济贸易大学.ppt