第二篇回归分析与相关分析
第二篇作业题
⒈证明题
⑴试证
①;
②。
证:①展开x、y的校正交叉乘积和可得
,
展开分母中的一部分即x的校正平方和得到
,
同理,展开y的校正平方和得到
.
下面的结果显而易见。
②根据上面展开的结果,容易得到
.
⑵假定的反函数为,试证。
证明:对于,我们有
;
完全类似,对于,可知
。
因此
。
⑶试证明
。
证明:根据下式
,
可知
.
因此,对于一元线性回归
.
⑷试证明
。
证明:根据定义
.
考虑到,以及
.
应有
.
从而
.
比较F和t的表达容易看出
.
⑸我们知道,一元线性方程的回归系数b和相关系数R可以表作
,,
式中
,
分别为x和y的校正平方和。要求:
①建立回归系数和相关系数的关系。
证明:显然关系如下
。
②证明对于标准化的x和y值,必有。
提示:数据标准化的公式为
()
式中
为平均值,而
为基于抽样方差的标准差。
证明:我们知道,对于标准化数据,均值为0,方差为1。根据数据标准化公式和校正平方和的定义
,
同理可得
。
将这些结果代入R与b的关系式,立即得到
。
(6)VIF计算公式的证明。考虑线性回归方程
,
以二元线性回归为例,证明如下问题。
①对于标准化的自变量,建立矩阵X*,则
为自变量x1和x2的简单相关系数矩阵。
② C的逆矩阵
的对角线的元素等于方程膨胀因子(VIF)值。
证明:
①参见第2章和关于因子分析一章的有关内容。
②相关系数矩阵表作
,
根据相关系数的性质,式中
, .
于是C的逆矩阵可以写作
,
根据线性代数知识可知,式中C矩阵对应的行列式为
,
C的伴随矩阵为
.
所以逆矩阵为
.
显然
,.
⒉计算题
为了估计山上积雪溶化后对河流下游灌溉的影响,在山上建立观测站,测得连续10年的观测数据如下表(见下表1-1)。
表1-1
年份
最大积雪深度x(米)
灌溉面积y(千亩)
xi2
yi2
xiyi
预测值
残差
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
∑
利用本节公式,借助Excel计算:
①表中各项指标;
②回归参数a、b,并给出回归模型;
③计算总平方和SSt即Syy、剩余平方和SSe及回归平方和SSr;
④验证如下关系
,,,.
⑤验证如下关系:SSt=SSr+SSe,即
.
⑥相关系数R和标准误差s;
⑦计算F值、t值和DW值;
⑧计算残差与自变量的相关系数,分析结果。
⑨,估计当年的灌溉面积大约为多少?
⒊多元回归分析
⑴为了考察工业、农业和固定资产投资对交通运输业的影响,利用SPSS统计分析软件对某省1970-1987年18年的产值数据进行多元回归分析和逐步回归分析,指出多重共线性的问题实质所在(见下表1-2)。
表1-2
序号
年份
工业产值x1
农业产值x2
固定资产投资x3
运输业产值y
1
1970
2
1971
3
1972
4
1973
5
1974
6
1975
7
1976
8
1977
9
1978
10
1979
11
1980
12
1981
13
1982
14
1983
95
第二篇回归分析与相关分析—作业 来自淘豆网www.taodocs.com转载请标明出处.