第12章
简单回归分析
Simple linear regression analysis
本章内容
第一节简单线性回归
第二节线性回归的应用
第三节残差分析
第四节非线性回归
双变量计量资料:每个个体有两个变量值
总体:无限或有限对变量值
样本:从总体随机抽取的n对变量值
(X1,Y1), (X2,Y2), …, (Xn,Yn)
目的:研究X和Y的数量关系
方法:回归与相关
简单、基本——直线回归、直线相关
第一节简单线性回归
英国人类学家 《自然遗传》一书中,提出并阐明了“相关”和“相关系数”两个概念,为相关论奠定了基础。其后,他和英国统计学家 Karl Pearson对上千个家庭的身高、臂长、拃长(伸开大拇指与中指两端的最大长度)做了测量,发现:
历史背景:
儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系: 。
也即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”
“回归”已成为表示变量之间某种数量依存关系的统计学术语,相关并且衍生出“回归方程”“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。
线性回归的概念及其统计描述
直线回归的概念
目的:研究应变量Y对自变量X的数量依
存关系。
特点:统计关系。 X值和Y的均数的关系,
不同于一般数学上的X 和Y的函数关系
为了直观地说明直线回归的概念,以15名健康人凝血酶浓度(X)与凝血时间(Y)数据(表12-1)进行回归分析,得到图12-1所示散点图(scatter plot)
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
X
Y
14
13
15
15
13
14
16
17
14
16
15
16
14
15
17
第十二章 简单回归分析 来自淘豆网www.taodocs.com转载请标明出处.