下载此文档

数据挖掘中聚类分析算法研究.pdf


文档分类:IT计算机 | 页数:约52页 举报非法文档有奖
1/52
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/52 下载此文档
文档列表 文档介绍
扬州大学
硕士学位论文
数据挖掘中聚类分析算法研究
姓名:谢怡文
申请学位级别:硕士
专业:计算机技术
指导教师:陈才扣
20100301
.甀—甌虢舶琸,,琄。·,.瑃,瓼·甦琩,—,畉—琣畂產.瓵:.琾仃,
扬州大学学位论文原创性声明和版权使用授权书学位论文原创性声明本人声明:所呈交的学位论文是在导师指导下独立进行研究工作所取得的研究成果。除文中已经标明引用的内容外,本论文不包含其他个人或集体已经发表的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。学位论文作者签名:签字日期:年学位论文版权使用授权书本人完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交学位论文的复印件和电子文档,允许论文被查阅和借阅。本人授权扬州大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息研究所将本学位论文收录到‘中国学位论文全文数据库:⑼ü缦社会公众提供信息服务。导师签名:月日数据挖掘中聚类分析算法研究
第一章绪论研究背景及选题意义随着计算机技术和信息技术的发展,人们可以方便地获取和存储大量的数据,不能满足现实的需求。因为传统的数据分析工具只能进行一些统计查询等操作,而不能获得数据之间的内在关系和隐含信息。为了从大量的数据中获得有价值的知识和信息,人们提出一种去粗存精、去伪存真的数据挖掘技术。它的目的在于提取海量数据中隐藏着的模式,从而发现人们感兴趣的知识。从挖掘的任务可以把数据挖掘分为:聚类、关联规则和分类发现等三大类【俊聚类是一种重要的数据分析技术,搜索并识别一个有限的种类集合或簇集合,从而描述数据。聚类分析作为统计学的一个分支,已经被广泛研究了许多年。而且,聚类分析也已经广泛地应用到诸多领域中,包括模式识别、数据分析、图像处理以及市场研究【。通过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布模式,以及数据属性之间的有趣的相互关系。聚类的用途是很广泛的,在生物学中,它可以被用来辅助研究动、植物的分类,可以对具有相似功能的基因进行分类,还可以用来发现人群中的一些潜在的结构。在商业上,聚类可以帮助市场分析人员从他们的消费者数据库中区分出不同的消费群体,并概括出每一类消费者的消费模式,可以从保险公司的数据库中发现汽车保险中具有较高索赔概率的群体等等:聚类还可以用来从地理数据库中识别出具有相似土地用途的区域。除此之外,聚类分析也可以作为其它算法绻亓7治龊头掷的预处理步骤,这些算法再在生成的类上进行处理。这样可以大大提高这些算法的执行效率。因此聚类分析已经成为数据挖掘领域中一个非常活跃的研究课题。惴ㄊ且恢志涞木劾喾治龇椒ǎ肒算法来聚类时,当结果同时也造成了巨量的数据堆积。面对这些海量的数据,传统的数据分析方法远远簇是密集的,而簇与簇之间区别明显时,它的聚类效果较好。该算法的缺点是:数据挖掘中聚类分析算法研究
.萃诰蛑械木劾喾治遗传算法与数据挖掘易陷入局部最优;此外,它对于噪声和孤立点数据是敏感的。由此可见,聚类算域,便于实时处理,而且具有较强的稳健性,可避免陷入局部最优。针对惴ù嬖诘娜毕荩诙愿盟惴ū旧斫懈慕耐保糯惴应用到惴ㄖ校茉诤艽蟪潭壬咸岣逰算法效率和聚类质量。所以,本课题研究不仅具有重要的科学理论意义,而且还具有重要的使用价值。聚类分析【鞘萃诰蛑幸恢址浅V匾5募际酰欠治鍪莶⒋又蟹⑾钟杏眯息的一种有效手段,它涉及到许多研究领域,包括数据挖掘、统计学、人工智能以及机器学****等。基于“物以类聚钠铀厮枷耄劾喟凑找欢ǖ木劾嘧荚蚪据对象分组成为若干个类,使得同一类中的对象之间尽可能相似,而不同类中的对象尽可能相异,通过聚类,人们能够识别密集和稀疏的区域,发现全局的分布模式以及数据属性之间有趣的相互关系。由于符合人类认知世界的思维模式,聚类分析广泛应用于很多方面,例如文本挖掘、信息检索、地质学、图像分割、生物学和客户关系管理等等。随着数据库中存储的数据越来越多,聚类分析已经成为数据挖掘中一个非常活跃的研究课题。,悄D馍镌谧匀换肪持械囊糯ê徒程而形成的一种全局随机搜索算法。它从一组初始可行解出发,在不需要除适应度函数之外的其它信息的条件下,对多个个体组成的种群进行选择、交叉、变异等操作,使个体间的信息得到交换,实现群体中的个体一代一代的演化并逐步逼它要求用户必须事先给出簇的数目担黄浯危猿跏季劾嘀行拿舾校⑶胰法存在很多不完善的地方,对它的进一步优化研究就显得尤为迫切和必要。这不仅有助于算法理论的完善,更有助于算法的推广和应用。遗传算法【渴且恢滞üD庾匀唤趟阉髯钣沤獾姆椒ǎ湎灾氐闶呛

数据挖掘中聚类分析算法研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数52
  • 收藏数0 收藏
  • 顶次数0
  • 上传人aena45
  • 文件大小2.06 MB
  • 时间2021-08-20