Clustering Analysis
第十九章
聚类分析
判别分析:已知分为若干类的前提下,判
定观察对象的归属。
聚类分析:不知道应分多少类的情况下,
进行探索性分析,对观察对象
依据某些数量特征适当分类。
(R型聚类)
(Q型聚类)
第一节相似系数
聚类分析的关键是如何定义类间的
相似性,如何把相似性数量化。
相似系数
:
简单相关系数(定量):
列联系数(定性):
R×C表Pearson2
0<C<1
:
将n例样品看成是m维空间的n个点,用两
点间距离定义相似系数。
(1)欧氏距离(Euclidean distance)
相似系数
(2)绝对距离(Manhattan distance)
相似系数
(3)明考斯基距离(Minkowski distance)
(4)马氏距离(Mahalanobis distance)
dij=X’ S-1 X
相似系数
X=
S=
第二节系统聚类
;
,形成矩阵;
;
,形成矩阵;
、4步,直至全部样品或指标并为
一类。
一、类间相似系数计算
当两类各含一个样品或指标时,两类间相似系数即两样品或指标间相似系数dij或rij。
当两类含有两个或以上样品或指标时,两类间相似系数有多种定义。
Gp、Gq表示两类,各含np、nq个样品或指标,共有np×nq个相似系数。
系统聚类
系统聚类
聚类分析(第19章) 来自淘豆网www.taodocs.com转载请标明出处.