§ 线性回归分析
线性回归分析的一般步骤:
1 确定回归方程中的解释变量和被解释变量
2 确定回归模型
3 建立回归方程、
4对回归方程进行各种检验
5 利用回归方程进行预测
一、回归分析原理
回归分析实际上就是建立某种数学模型并做检验。假定:一列(或多列)数据的变化同另一列数据的变化呈某种函数关系,衡量数据联系强度的指标,并通过指标检验其符合的程度,就称为回归分析。
回归分析包括:一元回归、多元回归以及线性回归和非线性回归:
一元回归:Y(因变量)取值:y1 y2 y3…
X(自变量)取值:x1 x2 x3 …
建立一元线性回归方程:Y=BX+C(方程中的B为回归系数,C为常数)
或者是非线性回归方程:Y=f(X)
多元回归:Y(因变量)取值: y1 y2 y3…
X1(自变量1)取值: x11 x12 x13 …
X2(自变量2)取值: x21 x22 x23 …
……
Xn(自变量n)取值: xn1 xn2 xn3 …
建立多元线性回归方程:Y=B1X1+B2X2…+ BnXn + B0(方程中的Bi为回归系数)
或者是非线性回归方程:Y=f(X1 X2…Xn)
二、回归分析的概念
假定测量数据为:
因变量自变量1 自变量2 …自变量n
y1 x11 x21 … xn1
y2 x12 x22 … xn2
…
…
…
ym x1m x2m … xnm
建立因变量与自变量的关系,回归方程:
Y=B1X1+B2X2 …+ B0
纳入前:
模型:
εj为随机因素影响,即残差。
纳入后:
方程:
要求组内离差平方和(各项与平均项之差的平方的总和) 最小。
纳入方程的自变量应满足:
回归方程的拟合优度检验
采用R2统计量。该统计量为调整的判定系数或调整的决定系数。
2回归方程显著性检验
X的变化应引起Y的显著变化。从而需要对回归方程做F检验。F检验的原假设是:各个偏回归系数同时与0无差异。它意味着,当偏回归系数同时为0是,无论各个xi 取值如何变化都不会引起y 的线性变化,所以x无法解释y的线性变化,y 与x的全体不存在线性关系。
总离差平方和:
回归均方差(组间方差):
残差均方差(组内方差):
计算F值,
由F值查表,得到P。讨论显著度水平:
<=α自变量作用显著
P
>α自变量作用不显著
将未进入方程的某自变量Xi与Y做方差分析,各水平均值差异显著,满足:
F > 或P<=
则该Xi可以进入回归方程。而已进入回归方程的Xi与回归后的Y如果出现:
F < , P>
则该Xi 必须从回归方程中剔除。
3. 回归系数的显著性检验
对已进入方程的变量的回归系数做T检验,该检验的原假设是Bi=0,即第i个偏回归系数与0无差异。它意味着,当偏回归系数Bi为0时,无论xi取值如何变化都不会引起y 的线性百脑汇,xi无法解释y 的线性变化,它们之间不存在线性关系。
T值的计算为:
通过查表可以得到P(即:Sig T)。
若P> 。
其中:
Bi为偏回归系数
SEBi为偏回归系数的标准误
③欲进入方程的自变量应当与已进入的自变量相关程度足够低。
引进描述相关程度的量:容忍度Tolerance,即变量之间的相关系数的显著度水平。若:
Tolerance >
表明欲进入方程的自变量与其它自变量的相关程度低,即:xi 与xj相关程度低,则xi可以进入回归方程。
回归方程检验只能检验所以偏回归系数是否同时为0。如果偏回归系数不同时为0,并不能保证方程组仍然存在某些偏回归系数为0的解释变量。回归系数检验正事为此对每个偏回归系数是否为0进行逐一考察。因此,多远线性回归中的这两种检验通常不能互相代替。
线性回归分析 来自淘豆网www.taodocs.com转载请标明出处.