下载此文档

应用多元统计分析习题解答_聚类分析.doc


文档分类:高等教育 | 页数:约20页 举报非法文档有奖
1/20
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/20 下载此文档
文档列表 文档介绍
第五章聚类分析 判别分析和聚类分析有何区别? 答: 即根据一定的判别准则, 判定一个样本归属于哪一类。具体而言, 设有 n 个样本, 对每个样本测得 p 项指标(变量)的数据,已知每个样本属于 k 个类别(或总体)中的某一类, 通过找出一个最优的划分, 使得不同类别的样本尽可能地区别开, 并判别该样本属于哪个总体。聚类分析是分析如何对样品( 或变量) 进行量化分类的问题。在聚类之前, 我们并不知道总体, 而是通过一次次的聚类, 使相近的样品( 或变量) 聚合形成总体。通俗来讲, 判别分析是在已知有多少类及是什么类的情况下进行分类, 而聚类分析是在不知道类的情况下进行分类。 试述系统聚类的基本思想。答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类, 过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 对样品和变量进行聚类分析时, 所构造的统计量分别是什么?简要说明为什么这样构造? 答: 对样品进行聚类分析时, 用距离来测定样品之间的相似程度。因为我们把 n 个样本看作 p 维空间的 n 个点。点之间的距离即可代表样品间的相似度。常用的距离为(一)闵可夫斯基距离: 1/ 1 ( ) ( ) pqq ij ik jk k d q X X ?? ?? q 取不同值,分为(1 )绝对距离( 1q?) 1 (1) p ij ik jk k d X X ?? ??(2 )欧氏距离( 2q?)2 1/ 2 1 (2) ( ) p ij ik jk k d X X ?? ??(3 )切比雪夫距离( q ??) 1 ( ) max ij ik jk k p d X X ? ??? ?(二)马氏距离(三)兰氏距离对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。将变量看作 p 维空间的向量,一般用(一)夹角余弦(二)相关系数 在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则? 答: 设d ij 表示样品 X i与X j 之间距离,用 D ij 表示类 G i与G j 之间的距离。(1). 最短距离法, min i k j r kr ij X G X G D d ? ?? min{ , } kp kq D D ?(2 )最长距离法, max i p j q pq ij X G X G D d ? ??, max i k j r kr ij X G X G D d ? ?? max{ , } kp kq D D ?(3 )中间距离法其中(4 )重心法 2 ( ) ( ) pq p q p q D X X X X ?? ? ?)( 1 qqppr rXnXnn X?? 2 2 2 2 2 p q p q kr kp kq pq r r r n n n n D D D D n n n ? ??(5 )类平均法 2 2 1 i p j j pq ij X G X G p q D d n n ? ???? 2 2 1 i k j r kr ij X G X G k r D d n n ? ???? 2 2 p q kp kq r r n n D D n n ? ?(6 )可变类平均法其中?是可变的且?<1 (7 )可变法 2 2 2 2 1 ( ) 2 kr kp kq pq D D D D ???? ??其中?是可变的且?<1 (8 )离差平方和法 1 ( ) ( ) tn t

应用多元统计分析习题解答_聚类分析 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数20
  • 收藏数0 收藏
  • 顶次数0
  • 上传人63229029
  • 文件大小1.08 MB
  • 时间2017-01-04