第4节 系统聚类分析
聚类要素的数据处理
距离的计算
直接聚类法
最短距离聚类法
最远距离聚类法
系统聚类法计算类之间距离的统一公式
系统聚类分析实例
系统聚类分析聚类要素的数据处理
一、聚类要素的数据处理
在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。
在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。
系统聚类分析聚类要素的数据处理
假设有m 个聚类的对象,每一个聚类对象都有n个要素构成。。
聚类对象与要素数据
系统聚类分析聚类要素的数据处理
在聚类分析中,常用的聚类要素的数据处理方法有如下几种:
① 总和标准化。分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即
这种标准化方法所得到的新数据满足
()
系统聚类分析聚类要素的数据处理
② 标准差标准化,即
由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有
()
系统聚类分析聚类要素的数据处理
③ 极大值标准化,即
经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。
④ 极差的标准化,即
经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。
()
()
系统聚类分析聚类要素的数据处理
例题:,它们经过极差标准化处理后,。
某地区9个农业区的7项经济指标数据
区代号
人均
耕地X1
/(hm2·人-1)
劳均
耕地X2
/(hm2·个-1 )
水田
比重
X3
/%
复种
指数x4
/%
粮食
单产x5
/(kg·hm -2)
人均粮食x6
/(kg·人-1 )
稻谷占粮食比重x7/%
G1
4
1
G2
2
G3
6
G4
111
4 458
G5
12 249
G6
8 973
G7
10 689
G8
3
G9
4
系统聚类分析聚类要素的数据处理
极差标准化处理后的数据
x1
x2
x3
x4
X5
X6
X7
G1
G2
G3
G4
G5
G6
G7
G8
G9
系统聚类分析聚类要素的数据处理
二、距离的计算
常见的距离有
① 绝对值距离
② 欧氏距离
系统聚类分析聚类要素的数据处理 来自淘豆网www.taodocs.com转载请标明出处.