下载此文档

《数据挖掘入门》.ppt


文档分类:IT计算机 | 页数:约91页 举报非法文档有奖
1/91
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/91 下载此文档
文档列表 文档介绍
该【《数据挖掘入门》 】是由【相惜】上传分享,文档一共【91】页,该文档可以免费在线阅读,需要了解更多关于【《数据挖掘入门》 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。数据挖掘入门Date1精选课件引言KDD与数据挖掘数据挖掘方法数据挖掘的应用和开展趋势数据预处理可视化数据挖掘Date2精选课件一、引言什么激发了数据挖掘近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛应用于各种领域,如商务管理、生产控制、市场分析、工程设计和科学探索等。面对海量数据库和大量繁杂信息,如何才能从中提取有价值的知识,进一步提高信息的利用率,由此引发了一个新的研究方向:基于数据库的知识发现〔KnowledgeDiscoveryinDatabase〕及相应的数据挖掘〔DataMining〕理论和技术的研究。Date3精选课件为什么数据挖掘是重要的数据的丰富带来了对强有力的数据分析工具的需求。快速增长的海量数据收集存放在大型和大量的数据库中,没有强有力的工具,这些数据就变成了“数据坟墓〞——难得再访问的数据档案。因此数据和信息之间的鸿沟要求系统地开发数据挖掘工具,将数据坟墓转换成知识“金块〞。,内涵也各不相同,目前公认的定义是由Fayyad等人提出的。所谓基于数据库的知识发现(KDD)是指从大量数据中提取有效的、新颖的、潜在有用的、最终可被理解的模式的非平凡过程。二、。该过程需要经历多个步骤,并且很多决策需要由用户提供。从宏观上看,KDD过程主要经由三个局部组成,即数据整理、数据挖掘和结果的解释评估。Date6精选课件知识发现〔KDD〕的过程数据清理筛选数据目标数据Knowledge预处理及变换变换后的数据数据挖掘解释/评估Date7精选课件知识发现〔KDD〕的步骤数据准备:了解KDD应用领域的有关情况。包括熟悉相关的知识背景,搞清用户需求。数据选取:数据选取的目的是确定目标数据,根据用户的需要从原始数据库中选取相关数据或样本。在此过程中,将利用一些数据库操作对数据库进行相关处理。数据预处理:对步骤2中选出的数据进行再处理,检查数据的完整性及一致性,消除噪声及与数据挖掘无关的冗余数据,根据时间序列和的变化情况,利用统计等方法填充丧失的数据。Date8精选课件数据变换:根据知识发现的任务对经过预处理的数据再处理,主要是通过投影或利用数据库的其它操作减少数据量。确定KDD目标:根据用户的要求,确定KDD要发现的知识类型。选择算法:根据步骤5确定的任务,选择适宜的知识发现算法,包括选取适宜的模型和参数。Date9精选课件数据挖掘:这是整个KDD过程中很重要的一个步骤。运用前面的选择算法,从数据库中提取用户感兴趣的知识,并以一定的方式表示出来。模式解释:对在数据挖掘步骤中发现的模式〔知识〕进行解释。通过机器评估剔除冗余或无关模式,假设模式不满足,再返回到前面某些处理步骤中反复提取。知识评价:将发现的知识以用户能了解的方式呈现给用户。其中也包括对知识一致性的检查,以确信本次发现的知识不会与以前发现的知识相抵触。Date10精选课件

《数据挖掘入门》 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数91
  • 收藏数0 收藏
  • 顶次数0
  • 上传人相惜
  • 文件大小4.40 MB
  • 时间2024-04-16