下载此文档

2021年虚拟变量哑变量回归讲义.ppt


文档分类:IT计算机 | 页数:约10页 举报非法文档有奖
1/10
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/10 下载此文档
文档列表 文档介绍
Contents
虚拟变量的建立
1
虚拟变量回归系数的意义
2
虚拟变量回归分析的检验
3
SPSS实例操作
4
虚拟变量哑变量回归
2021/1/26
1
一、虚拟变量的建立
虚拟变量(Dummy Variable):取值为0和1的变量,当案例属于一个虚拟
变量所代表的类别时,这个虚拟变量就赋值为1,否则变赋值为0
Di = 1 ,是女性
= 0 ,不是女性
例1:
例2:大学生年级变量具有四个类别,如何构造?
其中,
D1=1,是大一,否则为0; D2=1,是大二,否则为0;
D3=1,是大三,否则为0; D4=1,是大三,否则为0。
“虚拟变量陷阱”
虚拟变量哑变量回归
2021/1/26
2
虚拟变量的建立
D1+D2+D3+D4=1,说明D1,D2,D3,D4存在线性相关,造成多重共线性
解决办法:
原则:当一个分类量具有k个类别时,则仅引入k-1个虚拟变量。
当所有k-1个自变量都取0的时候,那这个案例就属于第k类,我们称这类为参照类,参照类不仅解决了共线性的问题,而且在分析回归结果时也有非常重要的意义
虚拟变量哑变量回归
2021/1/26
3
二、虚拟变量回归系数的意义
因变量为大学生的月支出,自变量有家庭月收入,年级,性别
建立回归方程:
(0)
其中,
DG2=1,是大二,否则为0;
DG3=1,是大三,否则为0;
DG4=1,是大三,否则为0。
DS=1,是女生,否则为0
虚拟变量哑变量回归
2021/1/26
4
虚拟变量回归系数的意义
(1)
参照类:大一男生(所有虚拟变量均取0)
变式1:大二男生(DG2=1,虚拟变量均取0)
(2)
变式2:大一女生(DS=1,虚拟变量均取0)
(3)
参照类中,b0为直线的截距,b1为直线斜率,即 INCOME 的回归系数
由式(1)到式(2),截距项增加了b2,因此b2就是大二男生比大一男生月支出高的部分;由式(1)到式(3),截距项增加了b4,因此b4就是大一女生比大一男生月支出高的部分。
差别截距:所有表示各类别虚拟变量的回归系数(bj)表示的是该类与参照类的均值之差。(对于序次变量还可计算相邻分类的边际效应,任意两类的边际效应)
虚拟变量哑变量回归
2021/1/26
5
虚拟变量回归系数的意义
1. 只考虑年级对月支出的影响 等价于 单因素方差分析(1-way ANOVA)
2. 同时考虑年级、性别对月支出的影响 等价于 双因素方差分析(2-way ANOVA)
只考虑主效应的双因素方差分析
3. 同时考虑年级、性别、家庭月收入的影响 等价于 协方差分析(ANCOVA)
含交互作用的饱和双因素方差分析
虚拟变量哑变量回归
2021/1/26
6
三、虚拟变量回归系数的检验
对整个模型的检验(F检验)
H0:B1=B2=…=Bk=0
H1:B1,B2,…,Bk中至少有一个不为0
对各回归系数的检验(t检验)
H0:Bj=0

2021年虚拟变量哑变量回归讲义 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数10
  • 收藏数0 收藏
  • 顶次数0
  • 上传人书犹药也
  • 文件大小894 KB
  • 时间2021-01-26