下载此文档

第14章管理统计学_图文-课件PPT(演示稿).ppt


文档分类:高等教育 | 页数:约35页 举报非法文档有奖
1/ 35
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 35 下载此文档
文档列表 文档介绍
演讲者:XXX第十四章聚类分析管理统计学Management statistics管理统计学Management 聚类分析概述例:对7种产品的销售情况进行检验。共有两个指标,销售额和销售量,其数值分别如下表所示。选择合适的统计方法对这些产品进行分类。 聚类分析概述如果将产品按照销售量和销售额的大小分成两类。易知,产品1,2,3是一类,产品4,5,6,7是一类。如果分成三类,则仍很易得产品1,2,3还是一类,产品4,5,6是一类,产品7自成一类。可见,产品的分类是没有给定标准的,完全从给出的样本数据出发进行分类。产品1和2,3在一类是因为在销售量和销售额上的接近,与产品4,5,6,7不在一类,则是因为在销售量和销售额上比较大的差距。 聚类分析概述主要用于辨认具有相似性的事物,并根据彼此不同的特性加以“聚类”,即自动分类,使同一类的事物具有高度的相似性,不同类的事物有较大的差异性。聚类分析的作用:人们无需自己先定义一个分类标准,聚类分析能够从现有的样本数据(或变量)出发,按它们的亲疏程度分成若干类,并能通过变量与变量(样本与样本)的连接状况,揭示在同一类别中不同变量或样本的亲疏程度。聚类分析的过程: 变量测量尺度的类型(1) 间隔尺度;(2) 顺序尺度;(3) 名义尺度。为了将样本进行分类,就需要研究样品之间的关系;为了将变量进行分类,就需要研究变量之间的关系。但无论是样品之间的关系,还是变量之间的关系,都是用变量来描述的,变量的类型不同,描述方法也就不同。通常,变量按照测量它们的尺度不同,可以分为三类。 距离和相似系数(1) 间隔尺度指标度量时用数量来表示,常为连续型和离散型指标变量,其数值由测量或计数、统计得到,如长度、重量、收入、支出等。一般来说,计数得到的数量是离散数量,测量得到的数量是连续数量。在间隔尺度中如果存在绝对零点,又称比例尺度。又称有序多态变量,这种变量没有明确的数量表示,只有次序关系,或虽用数量表示,但相邻两数值之间并没有绝对任何基数效应,它只表示一个有序状态序列,数值之间只有序数效应。如评价学生的学习成绩,分成优、良、中、差四等。(2)顺序尺度(3)名义尺度也称无序多态指标,指标度量时既没有数量表示也性状态,如性别的男、女,一年四季的春、夏、秋、冬等等。 样品间亲疏程度的测度变量之间的聚类,常用相似系数来测度变量之间的亲疏程度。样品之间的聚类,常用距离来测度样品之间的亲疏程度。研究样品或变量的亲疏程度的数量指标有两种:(1)距离,它是将每一个样品看作一个点,并用某种度量测量点与点之间的距离,距离近的归为一类,距离远的点应属于不同的类。(2)相似系数,相似系数的绝对值越接近于1,则变量或样品的关系越密切,性质越接近,当绝对值越接近于0,则变量或样品的关系越疏远,相似的为一类,不相似的属于不同类。 距离的定义和特点以dij表示第i个样本与第j个样本间的距离,需要满足以下四个条件:0 ;0 ;0 ;.ijijij jiij ik kjd i jd i jd d i jd d d i j?? ??? ? 常用距离的分类(1)欧氏距离(Euclidean distance)(2)欧氏距离平方(squared Euclidean distance )(5)明可斯基距离(Minkowski distance)(6)自定义距离(customized distance)(3)切比雪夫距离(Chebychev distance)(4)马氏距离(Block distance) 常用距离的分类两样本之间的距离是两个样本在每个变量上的相应值之差的平方和的平方根。(1)欧氏距离(Euclidean distance)??21EUCLID( , ) ( ) mi iix y x y m?? ??个变量两样本之间的距离是两个样本在每个变量上的相应值之差的绝对值的最大值。(2)欧氏距离平方(squared Euclidean distance )??21SEUCID( , ) ( )mi iix y x y m??

第14章管理统计学_图文-课件PPT(演示稿) 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数 35
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 huiwei2002
  • 文件大小 0 KB
  • 时间2016-03-02
最近更新