下载此文档

第六章聚类分析.ppt


文档分类:高等教育 | 页数:约58页 举报非法文档有奖
1/ 58
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 58 下载此文档
文档列表 文档介绍
第六章聚类分析
§1 聚类分析和聚类统计量
§2 聚合法聚类分析
§3 分解法聚类分析(最优分割法)
§4 应用简介
1
引言
地质学中有很多分类研究的问题,如沉积岩、古生物、矿物、油气藏、油气地球化学勘探指标的分类等是一些直接分类的例子;油气资源评价、油源对比等研究中也有分类;地层划分属于另一种分类。为叙述方便,在此把分类的具体目标统称为个体(样品或变量)。
聚类分析:根据个体之间的亲疏程度,将它们进行逐级定量分类的一种多元统计分析方法。
根据分类的不同方式,又把聚类分析分为聚合法和分解法聚类分析。
2
§1 聚类分析和聚类统计量
一、聚类分析
1
2
5
4
6
7
3
8
9
10
11
13
12
14

















图6-1 油气化探指标聚类谱系图
(1,2,…,14为化探指标编号)
引例:化探指标的分类
如某地区油气地表化探样品具有14项指标,按照指标相关程度分类,结果如图。类内指标具有密切的成因联系,据此可以化简研究系统。
参照上例,给出聚合法聚类分析的一般概念。
1. 聚合法聚类分析
3
聚合法聚类分析是按个体在性质或成因上的亲疏关系,把个体逐级聚集成类的一种多元统计分析方法。又称为点群分析,
对样品进行分类—称Q型聚类分析
对变量进行分类—称R型聚类分析
这种聚类分析开始时,每个个体各自为一类,然后以某种表示个体亲疏关系的统计量为分类依据,把彼此关系相对密切的个体合并为小类,再把关系相对密切的小类进一步合并,…,最后直到合并成一个大类为止。最终得到一个反映各对象间亲疏关系的分类结果—聚类分析谱系图,如图6-1。
4
例如{1 1 2 2 3 3}是6个个体,据个体的相似性,把个体分为3类,结果是:{1 1}、{2 2}、{3 3}。这是一种把大类分解成小类的问题,地层的岩性段划分属于这类问题。
2. 分解法聚类分析
这种聚类方法与聚合法“方向”恰好相反,开始时全部个体为1大类,依据某种分类指标,把全部个体分为2类、3类、…, 直到满足分类的要求为止。
二、聚类分析统计量
衡量个体间性质或成因亲疏(相似、相关)程度的统计指标。
5
1. 聚合法聚类统计量
设有n个样品,每个样品有m个变量,它们的观测值xij (i =1 , 2 ,…, n ; j =1 , 2 ,…, m)构成一个数据矩阵,记为:
第i行是第i个样品m个变量的观测值,可视为m 维空间的一个点或一个矢量;
由 Xn×m可以看出:
分类
对象
几个常用的聚类分析统计量:
6
样品间的相似性就是矩阵行间的相似性,对样品聚类就是将矩阵中相似程度高的行合并为类;
变量间的相关性就是矩阵列间的相关性,对变量聚类就是将矩阵中相关程度高的列合并为类。
(1) Q型聚类分析统计量
相似系数
设样品观测值:
第j 列是第j个变量的n次观测值,可视为n维空间的一个点或一个矢量;
7
(6-1)
如此,可形成一个相似系数矩阵R=[rij]n×n 。
将Xi与Xj看成两个矢量,则Xi与Xj的相似系数定义为两矢量夹角的余弦:
8
在上述相似系数矩阵中, rij =rji , rii=1。rij 越接近1,Xi与Xj的性质越相近。R描述了各样品间的相似程度。
9
(6-2)
矢量Xi与Xj的相关系数为:
相关系数
如此可形成一个相关系数矩阵R=[rij]n×n 。
在相关系数矩阵中: rij =rji , rii=1。rij越接近1,Xi与Xj的相关程度越大。
10

第六章聚类分析 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数 58
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 企业资源
  • 文件大小 0 KB
  • 时间2011-12-12
最近更新