下载此文档

地质数据处理11-聚类分析.ppt


文档分类:IT计算机 | 页数:约67页 举报非法文档有奖
1/67
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/67 下载此文档
文档列表 文档介绍
聚类分析洪金益中南大学地学院地质数据处理基础11第十一章聚类分析1引言2距离和相似系数3系统聚类法4动态聚类法1引言判别分析和聚类分析是两种不同目的的分类方法,它们所起的作用是不同的。判别分析方法假定组(或类)已事先分好,判别新样品应归属哪一组,对组的事先划分有时也可以通过聚类分析得到。聚类分析:将分类对象分成若干类,相似的归为同一类,不相似的归为不同的类。聚类分析分为Q型(分类对象为样品)和R型(分类对象为变量)两种。相似性的不同定义2距离和相似系数相似性度量:距离和相似系数。距离常用来度量样品之间的相似性,相似系数常用来度量变量之间的相似性。样品之间的距离和相似系数有着各种不同的定义,而这些定义与变量的类型有着非常密切的关系。变量的测量尺度通常变量按测量尺度的不同可以分为间隔、有序和名义尺度变量三类。间隔尺度变量:变量用连续的量来表示,如长度、重量、速度、温度等。有序尺度变量:变量度量时不用明确的数量表示,而是用等级来表示,如某产品分为一等品、二等品、三等品等有次序关系。名义尺度变量:变量用一些类表示,这些类之间既无等级关系也无数量关系,如性别、职业、产品的型号等。一、距离设xij为第i个样品的第j个指标,数据矩阵列于表。变量x1x2⋯xp样品1x11x12⋯x1p2x21x22⋯x2p⋮⋮⋮⋮nxn1xn2⋯xnp数据矩阵距离dij一般应满足的四个条件(i)dij≥0,对一切i,j;(ii)dij=0,当且仅当第i个样品与第j个样品的各变量值相同;(iii)dij=dji,对一切i,j;(iv)dij≤dik+dkj,对一切i,j,k。(Minkowski)(Lance和Williams)(Mahalanobis)(简称明氏距离)定义为 这里q为某一自然数。明氏距离有以下三种特殊形式:(i)当q=1时, ,称为绝对值距离,常被形象地称作“城市街区”距离;(ii)当q=2时, ,称为欧氏距离,这是聚类分析中最常用的一个距离;(iii)当q=∞时, ,称为切比雪夫距离。

地质数据处理11-聚类分析 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数67
  • 收藏数0 收藏
  • 顶次数0
  • 上传人416612240
  • 文件大小1.41 MB
  • 时间2019-09-03