下载此文档

第十章 聚类分析2..ppt


文档分类:高等教育 | 页数:约58页 举报非法文档有奖
1/58
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/58 下载此文档
文档列表 文档介绍
第八章
第三节
机动目录上页下页返回结束
聚类分析原理
聚类分析原理介绍
聚类分析中“类”的特征:
聚类所说的类不是事先给定的,而是根据数据的相似性和距离来划分
聚类的数目和结构都没有事先假定
聚类方法的目的是寻找数据中:
潜在的自然分组结构a structure of “natural” grouping
感兴趣的关系relationship
聚类分析原理介绍
什么是自然分组结构Natural grouping ?
我们看看以下的例子:
有16张牌
如何将他们分为
一组一组的牌呢?
A
K
Q
J
聚类分析原理介绍
分成四组
每组里花色相同
组与组之间花色相异
A
K
Q
J
花色相同的牌为一副
Individual suits
聚类分析原理介绍
分成四组
符号相同的牌为一组
A
K
Q
J
符号相同的的牌
Like face cards
聚类分析原理介绍
分成两组
颜色相同的牌为一组
A
K
Q
J
颜色相同的配对
Black and red suits
聚类分析原理介绍
分成两组
大小程度相近的牌分到一组
A
K
Q
J
大配对和小配对
Major and minor suits
聚类分析原理介绍
这个例子告诉我们,分组的意义在于我们怎么定义并度量“相似性”Similar
因此衍生出一系列度量相似性的算法
A
K
Q
J
大配对和小配对
Major and minor suits
聚类分析原理介绍
相似性Similar的度量(统计学角度)
距离Q型聚类(主要讨论)
主要用于对样本分类
常用的距离有(只适用于具有间隔尺度变量的聚类):
明考夫斯基距离(包括:绝对距离、欧式距离、切比雪夫距离)
兰氏距离
马氏距离
斜交空间距离
此不详述,有兴趣可参考《应用多元分析》(第二版)王学民
相似系数R型聚类
用于对变量分类,可以用变量之间的相似系数的变形如1-rij定义距离
这里不详细介绍这种聚类度量方法
聚类分析原理介绍
变量按测量尺度(Measurement Level)分类
间隔(Interval)尺度变量
连续变量,如长度、重量、速度、温度等
有序(Ordinal)尺度变量
等级变量,不可加,但可比,如一等、二等、三等奖学金
名义(Nominal)尺度变量
类别变量,不可加也不可比,如性别、职业等

第十章 聚类分析2. 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数58
  • 收藏数0 收藏
  • 顶次数0
  • 上传人s1188831
  • 文件大小1.23 MB
  • 时间2018-06-06