一元回归及 简单相关分析
Simple Regression and Correlation Analysis
第8章第一节
内 容概要
第一节 回归与相关的基本概念
第二节 一元线性回归方程
第四影响的散点图
土壤NaCI含量 / -1
0
干重/ -2
重复值
1
80
90
95
115
130
115
135
2
100
85
89
94
106
125
137
3
75
107
115
103
103
128
128
4
89
93
92
110
110
143
127
5
91
103
115
113
128
132
155
6
79
92
120
108
131
121
132
7
101
78
95
121
117
129
148
8
85
105
95
110
121
112
117
9
83
93
105
108
114
120
134
10
79
85
98
111
116
130
132
平均数
增加每一NaCI含量下观测次数(10次重复观测值及平均值如下)
每个NaCI含量下10次重复的散点图
“•”表示在各xi处y的平均值;“+”是第一次观测的数据
二、 一元正态线性回归模型
若X是可控制的变量,在实验无限重复之后,则可以得到在各xi上的Y的条件平均数μY·X ,这些平均数构成一条直线。
μY =α+βX
Y :NID(α+βX, σ2)
ε :NID(0, σ2)
Y =α+βX+ε
1、估计直线的一般表达式:
a:截距(intercept),直线与Y轴交点的纵坐标,
表示X=0时Y的平均值。
b:斜率(slope),回归系数(regression coefficient)。
意义:X每改变一个单位,Y平均改变b个单位。
b>0,Y随X的增大而增大(减少而减少)—— 斜上;
b<0,Y随X的增大而减小(减少而增加)—— 斜下;
b=0,Y与X无直线关系—— 水平。
|b|越大,表示Y随X变化越快,直线越陡峭。
三、参数α和β的估计
回归系数:一元线性回归线的斜率称为回归系数,表示自变量每改变一个单位,因变量平均改变的单位数。
回归线:根据回归方程所画出的直线称为回归线。
2、基本概念
回归方程: 称为Y对X的回归方程。
3、最优回归线的估计原理
最小二乘法(method of least square)原理:
在各种离差平方和中,以距平均数的离差平方和最小。
在回归问题中,则在xi处Y的实际观测值yi对条件平均数μY·xi离差平方和最小,也就是使各散点到直线的纵向距离的平方和最小。
即观测值与回归估计值之间的离差平方和
达到最小时的回归线作为最好的回归线。
4、β和α的最小二乘估计
⑴ β的最小二乘估计:
⑵ α的最小二乘估计:
X和Y的校正交叉乘积和,用SXY表示。
X的校正平方和,用SXX表示。
Y的总校正平方和,用SYY表示。
四、回归方程的计算实例
【】根据下表中的数据,计算干物重在NaCI含量上的回归方程。
土壤NaCI含量X / -1
0
干重Y / -2
80
90
95
115
130
115
135
解:
① 列出回归方程计算表:
(编码法)
X
X ’=X-
X ’ 2
Y
Y ’ =Y-110
Y ’ 2
X ’ Y ’
0
-
80
-30
900
72
-
90
-20
400
32
-
95
-15
225
12
0
0
115
5
25
0
130
20
400
16
115
5
25
8
135
25
625
60
和
0
-10
2600
200
② 利用公式计算SXY
一元回归及简单相关分析 来自淘豆网www.taodocs.com转载请标明出处.