下载此文档

多元统计分析-.ppt


文档分类:高等教育 | 页数:约77页 举报非法文档有奖
1/77
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/77 下载此文档
文档列表 文档介绍
多元统计分析-
2008年安全评价人员教育培训
距离和相似系数
相似性度量:距离和相似系数。
距离常用来度量样品之间的相似性,相似系数常用来度量变量之间的相似性。
样品之间的距离和相似系数有着各种不同的定义,而这些定义与变量的义及导出
设 为一个 维随机向量, ,
。考虑如下的线性变换
希望在约束条件 下寻求向量 ,使 得 达到最大, 就称为第一主成分。
设 为 的特征值,
为相应的单位特征向量,且相互正交。则可求得第一主成分为
它的方差具有最大值 。
如果第一主成分所含信息不够多,还不足以代表原始的 个变量,则需考虑再使用一个综合变 量 ,为使 所含的信息与 不重叠,应要求

我们在此条件和约束条件 下寻求向量 ,使得 达到最大,所求的 称为第二主成分。求得的第二主成分为

其方差为 。
一般来说, 的第 主成分是指:在约束条件 和 下寻求 ,使 得 达到最大。第 主成分为
主成分的性质


其中 ,即 ,且 互不相关。

由于


总方差中属于第 主成分 (或被 所解释)的比例为

称为主成分 的贡献率。
第一主成分 的贡献率最大,表明它解释原始变量
的能力最强,而 的解释能力依次递减。
主成分分析的目的就是为了减少变量的个数,因而一般是不会使用所有 个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来大的影响。
前 个主成分的贡献率之和

称为主成分 的累计贡献率,它表明
解释 的能力。
通常取(相对于 )较小的 ,使得累计贡献达到一个较高的百分比(如80%~90%)。此时,
可用来代替 ,从而达到降维的目的,而信息的损失却不多。
与主成分 之间的相关系数
在实际应用中,通常我们只对 与
的相关系数感兴趣。
从相关阵出发求主成分
样本的主成分
我们可以从协差阵 或相关阵 出发求得主成分。但在实际问题中, 或 一般都是未知的,需要通过样本来进行估计。设数据矩阵为

则样本协差阵和样本相关阵分别为
样本的主成分
一、样本主成分的定义
二、从 出发求主成分
三、从 出发求主成分
四、主成分分析的应用
五、若干补充及应用中需注意的问题
一、样本主成分的定义
若向量 在约束条件 下,使得的样本方差

达到最大,则称线性组合 为第一样本主成分。若向量 在约束条件 和
的样本协方差
下,使得 的样本方差

达到最大,则称线性组合 为第二样本主成分。一般地,若向量 在约束条件 和

多元统计分析- 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数77
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小落意心冢
  • 文件大小2.85 MB
  • 时间2022-05-20