下载此文档

数据挖掘--数据挖掘综述.doc


文档分类:IT计算机 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
数据挖掘--数据挖掘综述.doc文献综述(2011届)数据挖掘综述学生姓名 学号 院系 专业 指导教师 :超市的经营者希望将经常被同时购买的商品放在一起,以增加销售额;保险公司想知道购买保险的客户一•般具有哪些特征;医学研究人员希望从己有的成千丄万份病历小找出患某种疾病的病人的共同特征,从血为治愈这种疾病提供一些帮助等等。对于这些问题,现有信息管理系统屮的数据分析工具无法给出解决办法。因为无论统计、查询或报表,其处理方式都是对指定数据进行简单的数字处理,而不能对这些数据所包含的内在信息进行提取。而随着数据量的激增,人们越来越希望系统能够提供更高层次的数据分析功能,从而更好地支持决策或科研工作。正是为了满足这种要求,数据挖掘技术应运而生。1数据挖掘的概念所谓数据挖掘,就是从大量的、不完全的、有噪声的、模糊的、随机的数据库屮,提取隐含在其屮的、人们事先不知道的、但乂是潜在有用的信息和知识的过程。这个定义包括以下四个层次的含义:(1)数据源必须是真实的、大量的、含噪声的;(2)发现的是用户感兴趣的知识;(3)发现的知识要可接受、可理解、可运用,最好能用自然语言表达发现结果;(4)并不是要求发现放之四海而皆准的知识,也不是要去发现崭新的自然科学定理和纯数学公式,更不是什么机器定理证明,所有发现的知识都是相对的,是有特定前提和约束条件、面向特定领域的。数据挖掘基于的数据库类型主要有:关系型数据库、而向对象数据库、事务数据库、演绎数据库、吋态数据库、多媒体数据库、主动数据库、空间数据库、遗留数据库、异质数据库、文本型>信息库以及新兴的数据仓库(DataWarehouse)、特征规则、区分规则、分类规则、总结规则、偏差规则、聚类规则、、机器学****统计等,但它并非多种技术的简单组合,而是一个不可分割的整体,还需要其它技术的支持,,认清数据挖掘的Fl的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲H性,是不会成功的。。搜索所有与业务对象有关的内部和外部数据信息,并从屮选择出适用于数据挖掘应用的数据。数据的预处理。研究数据的质量,为进一步的分析作准备,并确定将要进行的挖掘操作的类型。数据的转换。将数据转换成一,个分析模型,这个分析模型是针对挖掘算法建立的,建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。,除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成。解释并评估结果,其使用的分析方法一•般应作数据挖掘操作血定,通常会用到可视化技术。。总之,数据挖掘过程需要多次的循环反复,才有可能达到预期的效果。3数据挖掘的主要方法我们知道,原有数据库技术只是将数据有效地组织和存贮在数据库屮,并对这些数据作一些简单的分析,大量的隐藏在数据内部的有用信息我们无法得到•而机器学****模式识别、统计学等领域却有大量的提取知识的方法,但没有和实际应用屮的海量数据结合起来,很

数据挖掘--数据挖掘综述 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人ttteee8
  • 文件大小83 KB
  • 时间2020-04-16