优秀精品课件文档资料主成分分析法 主成分分析法的基本原理主成分分析( ponents Analysis )是由 Hotelling 于 1933 年首先提出的,它是利用降维的思想,把多指标转化为少数几个综合指标的多元统计分析方法。 基本思想对原始变量相关矩阵结构关系进行研究, 找出影响某一经济过程的几个综合指标,使综合指标变为原来变量的线性组合,从而不仅保留了原始变量的主要信息,彼此之间又不相关,更有助于抓住主要矛盾。借助于一个正交变换 T ,将其分量相关的原随机向量 x=(x 1,x 2,L, …,x p) T ,转化成其分向量不相关的新随机向量 u=(u 1,u 2,L, …,u p) T, 这在代数上表现为将 x 的协方差阵变换成对角形阵,在几何上表现为将远坐标系变换成新的正交坐标系,使之指向样本点散布最开的 p个正交方向,然后对多维变量系统进行降维处理, 使之能以一个较高的精度转换成低维度变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。定义: 称为第 k 主成分分量的方差贡献率, 称为前 k 个主成分分量的累计方差贡献率。 11 p k i i ? ???? ?? ?? ?? 1 1 1 pk i i i i ? ??? ?? ?? ?? ?? ?? ?? ?? ?例:儿童身高和体重两个变量之间的关系。下表表示儿童身高与体重数据: 变量观测量身高 h体重 w 1h 1w 1 2h 2w 2 3h 3w 3 ┋┋┋ nh nw n 使用散点图表示儿童身高与体重 y 1 y 2wh θ i=1 ,2,┅┅, n 以该直线为一个坐标轴 y 1,以该轴的垂直线为另一个坐标轴 y 2。因为所有
主控战略k线 来自淘豆网www.taodocs.com转载请标明出处.