下载此文档

数据挖掘中聚类分析算法研究.pdf


文档分类:IT计算机 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
数据挖掘中聚类分析算法研究.PDF第 26 卷第 2 期通化师范学院学报 Vo l. 26 №2
2005 年 3 月 JO URNA L OF TONG H UA TEACH ERS'COLLEGE M ar. 2005
*
数据挖掘中聚类分析算法研究
赵法信1 , 王国业2
(1. 通化师院教务处, 吉林通化 134002;2. 沈阳建筑大学科技产业处, 辽宁沈阳 110168)
摘要:聚类分析是数据挖掘的一个主要研究方向, 目前其研究已深入到数据库、数据挖掘、统计等领域并取得了
很大的成就. 本文介绍了聚类分析的应用及数据挖掘对聚类算法的典型要求, 并对现有的传统聚类算法进行了分析
与评估. 最后介绍了聚类分析最新的研究方向- - 流数据聚类分析.
关键词:数据挖掘;聚类算法分析;流数据
中图分类号:T P311. 13 文献标识码:A 文章编号:1008 - 7974(2005)02 - 0011 - 03
1 概述
在企业(如零售、金融、电信) 的大型数据库中蕴含的有用的信息资源促进了知识发现和数据挖掘的蓬勃发展. 聚类作为
数据挖掘中一个重要的组成部分, 主要用于在潜在的数据中发现有价值的数据分布和数据模式. 目前其研究已深入到数据
库、数据挖掘、统计等领域并取得了很大的成就.
聚类问题可以定义如下:给定 d 维空间的 n 个数据点, 把这 n 个点分成 k 个组, 即满足最大的组内相似性和最小的组间相
似性, 使得不同聚类中的数据尽可能地不同, 而同一聚类中的数据尽可能地相似[ 1].
聚类已经作为一种基本的数据挖掘方法广泛地应用于相似搜索、顾客划分、模式识别、趋势分析等领域中. 聚类算法在金
融投资、地理信息系统、卫星图象和信息检索等领域有着广泛的应用. 例如:在交易数据库中, 顾客一次购买的商品(数据项)
构成了一条交易, 将经常同时购买的数据项聚类到一起有利于改善商品的布置, 提高销售利润;将具有相似的购买模式的顾
客聚类到一起, 分析每一类顾客的特征, 有利于对特定的顾客群进行特定商品的宣传和销售. 类似地, 电子商务在每天的日常
业务中, 都会产生大量的数据. 这些信息被 Web 服务器自动收集并存储在访问日志中, 经过处理转换为交易数据库. 分析这
些信息能帮助销售商确定相对固定的顾客群, 制定商品的销售方案, 评价各种促销活动的有效性, 以及发现 W eb 空间最有效
的逻辑结构. 在信息检索领域中, 聚类分析对文档进行分类, 改善信息检索的效率, 或者发现某一领域文献的组成结构. 在医
疗分析中, 通过对一组新型疾病聚类, 得到每类疾病的特征描述, 就可以对这些疾病进行识别, 提高治疗的功效. 聚类还能帮
助医生发现不属于正常类别的特殊病例, 例如识别组织结构的病变细胞. 聚类还用于发现空间趋势, 即空间数据库中一个或
多个非空间属性的变化模式. 在天文学上, 研究人员利用聚类分析宇宙仿真系统得到的数据, 更好地理解黑洞形成和进化的
物理过程.
2 数据挖掘算法对聚类的典型要求
聚类是一个富有挑战性的研究领域, 它的潜在应用提出了各自特殊的要求, 因而每一种算法都是针对不同的情况而设计
的, 在数据挖掘领域对聚类算法的要求主要有以下几个方面[ 2] :
①可伸缩性.

数据挖掘中聚类分析算法研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人changjinlai
  • 文件大小249 KB
  • 时间2017-08-31