一元回归及简单相关分析
第1页,共63页,2022年,5月20日,23点24分,星期六
最高月产、
猪瘦肉率与背膘厚度、眼肌面积、胴体长;
绵羊产毛量与体重、胸围、体长 ;
黑白花奶牛的一胎305天产奶量与
、最3页,2022年,5月20日,23点24分,星期六
如果呈因果关系的两个相关变量y(依变量)与x(自变量)间的关系是直线关系,根据n对观测值所描出的散点图,如图8—1(b)和图8—1(e)所示。
由于依变量y的实际观测值总是带有随机误差,因而依变量y的实际观测值yi可用自变量x的实际观测值xi表示为:
(i=1,2, …, n) (8—1)
第11页,共63页,2022年,5月20日,23点24分,星期六
其中:
x 为可以观测的一般变量(也可以是可以观测的随机变量);
y 为可以观测的随机变量;
这就是直线回归的数学模型。我们可以根据实际观测值对α,β以及方差 做出估计。
i为相互独立,且都服从N(0, )的随机变量。
第12页,共63页,2022年,5月20日,23点24分,星期六
在x、y直角坐标平面上可以作出无数 条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。
下一张
主 页
退 出
上一张
设回归直线的方程为:
(8-2)
第13页,共63页,2022年,5月20日,23点24分,星期六
其中,a是α的估计值,b是β的估计值。
a、b应使回归估计值 与实际观测值y的偏差平方和最小,即:
根据微积分学中的求极值的方法,令 Q对a、b的一阶偏导数等于0,即:
最 小
第14页,共63页,2022年,5月20日,23点24分,星期六
整理得关于a、b的正规方程组:
下一张
主 页
退 出
上一张
解正规方程组,得:
(8-3)
(8-4)
第15页,共63页,2022年,5月20日,23点24分,星期六
(8-3)式中的分子是自变量x的离均差 与 依 变 量 y 的 离 均 差 的 乘 积和 ,简 称 乘积和,记作 ,分母是自变量x的离均差 平方和 ,记作SSX。
a叫做样本回归截距,是回归直线与
y轴交点的纵坐标,当x=0时, =a;
第16页,共63页,2022年,5月20日,23点24分,星期六
b叫做样本回归系数,表 示 x 改 变一个单位,y平均改变的数量;b 的符号反映了x影响y的性质,b的绝对值大小反映了 x 影响 y 的 程度;
的估计值。
叫做回归估计值,是当x在在其研
究 范 围 内 取某一个值时,y值平均数
第17页,共63页,2022年,5月20日,23点24分,星期六
回归方程的基本性质:
如果将(8-4)式代入(8-2)式,得到回归方程的另一种形式(中心化形式):
下一张
主 页
退 出
上一张
性质1
最小;
性质2
;
性质3 回 归 直 线 通 过 点
。
(8-5)
第18页,共63页,2022年,5月20日,23点24分,星期六
【】在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。
第19页,共63页,2022年,5月20日,23点24分,星期六
表8-1 四川白鹅雏鹅重与70日龄重测定结果
(单位:g)
下一张
主 页
退 出
上一张
第20页,共63页,2022年,5月20日,23点24分,星期六
1、作散点图 以雏鹅重(x)为横坐标,70日龄重(y)为纵坐标作散点图,见图8-3。
2、计算回归截距a,回归系数b,建立直线回归方程
首先根据实际观测值计算出 下 列数据:
第21页,共63页,2022年,5月20日,23点24分,星期六
下一张
主 页
退 出
上一张
第22页,共63页,2022年,5月20日,23点24分,星期六
进而计算出b、a:
得到四川白鹅的70日龄重y对雏鹅重x的
直线回归方程为:
第23页,共63页,2022年,5月20日,2
一元回归及简单相关分析 来自淘豆网www.taodocs.com转载请标明出处.