下载此文档

数据挖掘中聚类分析算法的研究.pdf


文档分类:IT计算机 | 页数:约58页 举报非法文档有奖
1/58
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/58 下载此文档
文档列表 文档介绍
山东师范大学
硕士学位论文
数据挖掘中聚类分析算法的研究
姓名:王鑫
申请学位级别:硕士
专业:计算机软件与理论
指导教师:刘希玉;王洪国
20060419
摘要随着计算机应用的普及,信息系统产生的数据量日益增大,如何有效地利用巨量的原始数据分析现状和预测未来,己经成为人类面薜囊淮筇粽健S纱耸挖掘技术应运而生并得以迅猛发展,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。数据挖掘殖莆J菘庵械闹J斗⑾简称,是从大量数据中提取可信的、新颖的、有效的并能被人们理解的模式的处理过程。数据挖掘是一门新兴的技术,它以数据库技术作为基础,把逻辑学、统计学、机器学****模糊学、可视化计算等多门学科的成果综合在一起,进行如何从数据库中得到有用信息的研究。数据挖掘技术得到了人们的普遍关注,广泛应用于银行金融、保险、公共设施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研上。聚类分析是数据挖掘中的一个重要研究领域。所谓聚类,就是把没有类别标记的样本集按某种准则划分成若干类,使类内样本的相似性尽可能大,而类间样本的相似性尽量小,是一种无监督的学****方法。聚类分析通常是在没有先验知识支持的前提下进行的,它所要解决的就是在这种前提下,实现满足要求的类的聚合。聚类分析的研究主要集中在聚类算法上,产生性能好而且实用的聚类算法是其终极目的。迄今为止,人们提出了很多种不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户,而且它们在理论和方法上仍不完善,甚至还有严重的不足之处。对聚类算法的进一步优化研究将不仅有助于算法理论的完善,更有助子算法的推广和应用。本文对数据挖掘技术,尤其是聚类分析进行了较为系统地分析和研究,提出了一些改进的算法,主要包括以下一些内容:萃诰蚣际醯母攀觥=樯芰耸萃诰虻幕靖拍睢⒎掷唷⒅饕9δ堋关键技术以及典型应用等等。萃诰蚬ぞ叩难芯俊=樯芰私惺萃诰虻某S霉ぞ撸ü咛迨道对当今国际上先进的数据挖掘工具虳男阅芙辛硕员龋⒌出了结论。劾喾治龅淖凼觥1疚亩允萃诰蛄煊虻木劾喾治龇椒ḿ按硭惴ń了分析,提出了数据挖掘对聚类的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了比较,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。山东师范大学硕士学位论文
法不足的基础上,提出了一种基于数据分区的算法——惴ǎ砺分析和实验证明该算法能较好地改进聚类质量,从而得到较佳的聚类结果。关键词:数据挖掘聚类分析数据分区最近邻优先吸收中图分类号:谑莘智淖罱谟畔染劾嗨惴惴,提出了一种改进的聚类算法。最近邻优先吸收算法可以快速进行聚类并且能有效处理噪声点,但当数据密度和聚类问的距离不均匀时聚类质量较差。本文在分析算山东师范大学硕士学位论文
琒,,琣.;,甎瓼,山东师范大学硕士学位论文.甌,琫瓺,,,琲.,,瑃,,,,猟.猭.琤甇。
琒珻,狹::山东师范大学硕士学位论文琫.琧,琸.甌,甌瓾.—.,,
聊酶咖司卅蒡学位论文作者签名:五鑫学位论文作者躲支詹剔磁毛少眵読矸月』独创声明学位论文版权使用授权书签字日期:寄昕T隆日本学位论文作者完全了解堂撞有关保留、使用学位论文的规定,有权保本人授权』兰±蔓可以将学位论文的全部或部分内容编入有关数据库进行检索,可本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研究成果,也不包含为获得没有其他需要特别声明的,本栏可空蚱渌逃沟难换蛑な槭褂霉牟料。与我~同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。以采用影印、缩印或扫描等复制手段保存、汇编学位论文。C艿难宦畚脑解密后适用本授权书导师签字签字日期:
研究背景及意义第一章绪论随着计算机科学与技术的发展,计算机被应用到各行各业,计算机软件带来以不同形式存储的数据资料。由于这些资料十分繁杂,如何从中发现有价值的信息或知识,达到为决策服务的目的,成为非常艰巨的任务。当前,人们正逐步陷虻サ厮担褪谴哟罅康摹⒉煌耆ǖ摹⒂性肷的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。何为知识庸阋迳侠斫猓荨⑿畔⒁彩侵J兜谋硐中问剑侨嗣歉的异构型数据。发现知识的方法可以是数学的,也可以是非数学的:可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和涉及到机器学****统计学、智能数据库、知识获取、数据可视化、高性能计算等诳蒲а芯糠矫妫乇鹗羌扑憧蒲а芯浚婕按罅康氖笛榛蚬鄄馐的效率、效益越

数据挖掘中聚类分析算法的研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数58
  • 收藏数0 收藏
  • 顶次数0
  • 上传人aena45
  • 文件大小1.78 MB
  • 时间2021-08-20