下载此文档

聚类分析.docx


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
聚类分析

聚类分析法是理想的多变量统计技术,主要有分层聚类法和迭代聚类法。 聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。

K-means算法、凝聚聚类算法以及EM算法系统聚类法和K均值聚类法是聚类分析中最常用的两种方法
经典的聚类分析方法:【数据挖掘中聚类算法研究和发展-周涛】

K-means 算法是一种最为典型的基于划分的聚类分析算法,自从该算法被开发出来后,就一直被拿来研究和改进。该算法的主要思想是大家非常了解的,首先随机选取 K个对象作为中心点,然后遍历每个数据对象,直到收敛为止。

DBSCAN 算法是一种较为常见的基于密度的聚类分析算法,该算法首先需要将任意的数据对象设定为核心数据对象,在 Eps 范围内包含的数据对象数目要不少于Minpts 规定的个数,然后根据相应的规则来对核心对象进行合并,最终完成类簇的聚类分析。

BIRCH 算法[28]是一种出现较为基本且简单的可以进行良好的伸缩的层次聚类算法。该算法具有较好的聚类表现,它主要包含两个概念:聚类特征(CF)和聚类特征树(CF-Tree),通过这两个概念来进行描述并使得该算法能够有效地处理数据集。

Yang W 等人提出的 STING(Statistical INformation Grid)算法的的核心思想是将目标数据集映射到矩形单元,该空间区域通过分层和递归方法进行划分,其主要是基于多分析率的网格算法。

EM(Exception-Maximization)算法是一种基于模型的聚类方法,该算法主要分为两步,期望步和最大化步。期望步先给定当前的簇中心,将每个数据对象划分到距离簇中心最近的簇,然后最大化步调整每个簇中心,使得该分派的数据对象到新中心的距离之和最小化,直到聚类收敛或改变充分小。

【高维数据聚类算法的研究及应用_孙志鹏】
随着信息技术的迅速发展,信息化的数据不断积累,高维空间数据的分析成为一个亟待解决的问题。因此,高维数据聚类分析成为聚类分析中一个重要的课题。目前,在高维数据聚类分析方面主要有基于传统聚类算法的改进,子空间聚类算法和基于数据对象相似度的聚类分析算法。
历经几十年的发展,研究学者已经针对不同的应用提出了许多改进的算法,大多数是基于常见的K-means算法、凝聚聚类算法以及EM算法等等的改进。其主要任务是从大量的数据中处理并且分析数据集中隐藏的信息。
现存的大多数聚类算法处理高维数据时往往需要高昂的时空开销,并且算法执行结果往往令人失望,这种现象产生的主要原因有两个:一方面在于高维数据集可能无法在人类的思维能力和视觉感官上清晰地描述与显示出来,不同的高维数据集蕴含的信息差异性非常大,同种算法不能很好地适应于实际的高维数据集;另一方面在于高维数据的所有对象在高维空间是稀疏分布的,因此无法很好地通过欧式距离来判断两个数据对象是否能够有相似的特征和聚为一类的信息。为了实现对真实且复杂的高维数据集的高效分析,许多的学者在近些年进

聚类分析 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人luciferios02
  • 文件大小16 KB
  • 时间2021-04-09