下载此文档

数据挖掘中聚类分析算法研究.pdf


文档分类:IT计算机 | 页数:约58页 举报非法文档有奖
1/58
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/58 下载此文档
文档列表 文档介绍
山东师范大学硕士学位论文摘要随着计算机应用的普及,信息系统产生的数据量日益增大,如何有效地利用巨量的原始数据分析现状和预测未来,己经成为人类面l晦的一大挑战。由此数据挖掘技术应运而生并得以迅猛发展,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。数据挖掘(Data Mining),又称为数据库中的知识发现(简称KDD),是从大量数据中提取可信的、新颖的、有效的并能被人们理解的模式的处理过程。数据挖掘是一门新兴的技术,它以数据库技术作为基础,把逻辑学、统计学、机器学****模糊学、可视化计算等多门学科的成果综合在一起,进行如何从数据库中得到有用信息的研究。数据挖掘技术得到了人们的普遍关注,广泛应用于银行金融、保险、公共设施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研上。聚类分析是数据挖掘中的一个重要研究领域。所谓聚类,就是把没有类别标记的样本集按某种准则划分成若干类,使类内样本的相似性尽可能大,而类间样本的相似性尽量小,是一种无监督的学****方法。聚类分析通常是在没有先验知识支持的前提下进行的,它所要解决的就是在这种前提下,实现满足要求的类的聚合。聚类分析的研究主要集中在聚类算法上,产生性能好而且实用的聚类算法是其终极目的。迄今为止,人们提出了很多种不同的适用于数据挖掘的聚类算法, 但这些算法仅适用于特定的问题及用户,而且它们在理论和方法上仍不完善,甚至还有严重的不足之处。对聚类算法的进一步优化研究将不仅有助于算法理论的完善,更有助子算法的推广和应用。本文对数据挖掘技术,尤其是聚类分析进行了较为系统地分析和研究,提出了一些改进的算法,主要包括以下一些内容: (1)数据挖掘技术的概述。介绍了数据挖掘的基本概念、分类、主要功能、关键技术以及典型应用等等。(2)数据挖掘工具的研究。介绍了进行数据挖掘的常用工具,通过具体实例对当今国际上先进的数据挖掘工具(SPSS和DBMiner)的性能进行了对比,并得出了结论。 f3)聚类分析的综述。本文对数据挖掘领域的聚类分析方法及代表算法进行了分析,提出了数据挖掘对聚类的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了比较,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。山东师范大学硕士学位论文(4)基于数据分区的最近邻优先聚类算法(PNNAF算法),提出了一种改进的聚类算法。最近邻优先吸收(NNAF)算法可以快速进行聚类并且能有效处理噪声点,但当数据密度和聚类问的距离不均匀时聚类质量较差。本文在分析NNAF算法不足的基础上,提出了一种基于数据分区的NNAF算法——PNNAF算法,理论分析和实验证明该算法能较好地改进聚类质量,从而得到较佳的聚类结果。关键词:数据挖掘聚类分析数据分区最近邻优先吸收中图分类号:TP311 山东师范大学硕士学位论文 ABSTRACT With the wide usage ofinformation technology,data generated from different information systems e more and toutilizethehuge original data to analyse current situation andpredict futureofquantities effectively,have already e agreat challenge thatthemankind has thedata mining technology isarised atthehistoricmoment and can bedeveloped rapidly,which is attributed tothe necessary consequence oftheconflicting movement between the rapidincreasing dataandthe。poorinformation dayby day. Data Mining,also called as knowledge discovery ofdatabases(KDD),is a processing procedure of extracting credible,novel,effective and understandable patterns from Mining is arelativelyyoung research andapplication area based on database techniques,which synthesizes multidisciplinary product

数据挖掘中聚类分析算法研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数58
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wh7422
  • 文件大小0 KB
  • 时间2016-07-03