下载此文档

聚类分析 - 聚类分析-课件·PPT.ppt


文档分类:高等教育 | 页数:约135页 举报非法文档有奖
1/135
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/135 下载此文档
文档列表 文档介绍
聚类分析 (Cluster Analysis)
问题的引出
经济、社会、人口研究中,存在着大量分类研究、构造分类模式的问题
经济研究中,根据经济发展水平把各个国家分成发达国家、中等发达国家、发展中国家;为了研究不同地区城镇居民生活中的收入及消费状况,往往需要划分为不同的类型去研究
市场营销中按照消费者的特征对消费者分类,按照产品特征对产品分类,从而进行市场分层、建立目标市场
为多种动物群体——昆虫、哺乳动物和爬行动物的区分建立生物分类学
……
分类需要解决的问题
如何划分
划分的标准是什么
需要选取能够描述不同样品特征的变量,依据这些不同变量将样本划为不同的类别
依据描述样品之间相同性质的“相似性”指标
前言
聚类分析是用多元统计理论进行分类的一种方法
聚类的原则是“组(类)内同质,组(类)间差异”
本讲所介绍的是系统聚类法、动态聚类(K-均值聚类)和有序样品聚类法
聚类分析的概念
聚类分析是通过被分类的对象的各种指标进行分类的,而指标按其测量的尺度可以有以下三种:
间隔尺度:指标用连续的实值变量表示,如长度、重量、时间;
有序尺度:用该指标度量时无数量表示,只表示次序,如产品质量的等级;
名义尺度:该指标只代表某些分类或属性,不代表大小和次序,如性别。
数据表
指标
样品
1 2 … p
1
2
...
n
x11 x12 … x1p
x21 x22 … x2p

xn1 xn2 … xnp
聚类分析的分类
在实际问题中,收集n个样品,对每一个样品测量 p 个指标:
Q型聚类
根据p个指标值对n个样品进行分类
如,根据多项经济指标(指标)对不同的地区(样品)进行分类
R型聚类
根据n个样品对p个指标进行分类
根据不同地区的样本数据对多个经济指标进行分类
两者没有本质区别,实践中人们更感兴趣的通常是Q型聚类
本讲主要内容
系统聚类
K-均值聚类
有序样品聚类
系统聚类法
系统聚类基本思路和步骤
样品间距离
类间距离
系统聚类的应用
系统聚类的思想
产品质量分类
从21个工厂各抽一件同类产品,每件产品测量两个质量指标,记为x1与x2,现要求将各厂的产品按质量情况进行分类
将每个工厂产品的两个指标看成平面上的一个点,并在坐标平面上将21个点画出来。
基本思想:逐步将距离近的类合并在一起

聚类分析 - 聚类分析-课件·PPT 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数135
  • 收藏数0 收藏
  • 顶次数0
  • 上传人aidoc1
  • 文件大小0 KB
  • 时间2015-10-02