补充材料:二元选择摸型
如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项议案的态度,支持还是反对;某个事件的最终结果是成功,还是失败等。当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型(离散选择模型)。这里主要介绍三种模型,Tobit(线性概率)模型,Probit(概率单位)模型和Logit模型。
(线性概率)模型
Tobit模型的形式如下,
yi = a + b xi + ui (1)
其中xi为定量解释变量,yi为二元选择变量,ui为随机误差项。此模型由James Tobit提出,因此得名。设
1 (若是第一种选择)
yi =
0 (若是第二种选择)
对yi取期望,
E(yi) = a + b xi (2)
下面研究yi的分布。因为yi只能取两个值,0和1,所以yi 服从两点分布。把yi的分布记为,
P( yi = 1) = pi
P( yi = 0) = 1 - pi
则
E(yi) = 1 (pi) + 0 (1 - pi) = pi (3)
由(2)和(3)式有
pi = a + b xi (yi的样本值是0或1,而预测值是概率。) (4)
以pi = - + xi 为例,说明xi 每增加一个单位,。假设用这个模型进行预测,当预测值落在[0,1] 区间之内(即xi取值在[4, 24] 之内)时,则没有什么问题;但当预测值落在[0,1] 区间之外时,则会暴露出该模型的严重缺点。因为概率的取值范围是[0,1],所以此时必须强令预测值(概率值)相应等于0或1(见图
1)。线性概率模型常写成如下形式,
1, a + b xi ³ 1
pi = a + b xi , 0 < a + b xi < 1 (5)
0, a + b xi £ 0
图1
然而这样作是有问题的。假设预测某个事件发生的概率等于1,但是实际中该事件可能根本不会发生。反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。
由于线性概率模型的上述缺点,希望能找到一种变换方法,(1)使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间。(2)同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。显然累积概率分布函数F(zi) 能满足这样的要求。采用累积正态概率分布函数的模型称作Probit模型。用正态分布的累积概率作为Probit模型的预测概率。另外logistic函数也能满足这样的要求。采用logistic函数的模型称作logit模型。
(概率单位)模型,仍假定
yi = a + b xi ,
而
pi = F ( yi) = (6)
累积概率分布函数曲线在pi = 。对应yi在实轴上的值,相应概率值永远大于0、小于1。显然Probit模型比Tobit模型更合理。Probit模型需要假定yi 服从正态分布。
该模型是McFadden于1973年
讲义10二元选择摸型 来自淘豆网www.taodocs.com转载请标明出处.