两个随机变量Y与X → 简单相关系数
一个随机变量Y与一组随机变量X1, X2,…, Xp → 复相关系数(多重相关)
一组随机变量Y1,Y2,…,Yq与另一组随机变量X1,X2,…,Xp → 典型相关系数
典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。
由Hotelling (1935, 1936)最早提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它的应用。
第一节典型相关分析的基本思想
典型相关是简单相关、多重相关的推广;或者说简单相关系数、复相关系数是典型相关系数的特例。
例:收集了某年某省男生(19~22岁)的资料,欲研究形态指标与机能指标间的相关性。
形态指标:身高、坐高、体重、胸围、肩宽、盆骨宽;
机能指标:脉搏、收缩压、舒张压、肺活量。
典型相关分析示意图
X1
Y1
Y2
Y3
Y4
Y5
X2
X3
X4
X5
X6
X
Y
U1
U2
U3
U4
U5
V1
V2
V3
V4
V5
CanR1
CanR2
CanR3
CanR4
CanR5
典型相关分析(canonical correlation analysis) :为了研究两组变量之间的相互关系,分别从两组变量中提取综合变量(为两个变量组中各变量的线性组合),并利用各综合变量之间的相关性来反映两组指标之间整体相关性的一种多元统计分析方法。
第二节典型相关分析的数学模型
设有两组变量为X1,X2…,Xp和Y1,Y2,…,Yq,采用主成分思想寻找综合变量对即典型(相关)变量(Ui,Vi):
7
典型相关变量对与典型相关系数:
在典型相关分析中,分别从两组原始变量中提取的能反映两组原始变量间整体相关信息的综合变量称为典型相关变量,典型相关变量是成对出现的,并且是按其反映两组原始变量间整体相关信息量的大小排序的,如U1、V1之间的相关系数最大,则称U1、V1 为第一对典型相关变量,它们之间的相关系数称为第一典型相关系数,类似地有第二对,第三对,…,第i对典型变量和第二、第三,…,第i典型相关系数。
典型相关变量的性质:
9
即:
同一组指标的各典型变量(Ui与Uj)(j=1,2,…,i-1)之间互不相关;
不同组指标的典型变量(Ui与Vj)(i≠j)之间互不相关;
各典型变量Ui与Vj的方差均为1;
10
第三节典型相关变量及典型相关系数的求法(了解)
。
,Y的相关矩阵ΣXX,ΣYY及X与Y的相关矩阵ΣXY 。
,进而求得各典型相关系数,并按大小顺序排列。
,进而求得非零解a1′= (a11,a12 ,…,a1p ) ,
b1 ′= ( b11,b12 ,…,b1q )
。
。
典型相关分析研 来自淘豆网www.taodocs.com转载请标明出处.