下载此文档

数据挖掘技术及其应用.doc


文档分类:IT计算机 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
数据挖掘技术及其应用.doc数据挖掘技术及其应用
摘要:随着网络、数据库技术的迅速发畏以及数据库管理系统的广泛
应用,人们积累的数据越来越多。数据挖掘(Data Mining)就是从大量的实际应用数据中提取隐含信息和知 识,它利用
了数据库、人工智能和数理统计等多方面的技术,是一类深层次的数据分析方法。
关键词:数据挖掘;知识;分析;市场营销;金融投资
随着网络、数据库技术的迅速发展以及数据库管理系统的广泛
应用,人们积累的数据越来越多。由此,数据挖掘技术应运而生。下面,本文对数据技术及其应用作一简 单介绍。
一、 数据挖掘定义
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含 在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一种新的商业信息处理技术, 其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商 业决策的关键性数据。简而言之,数据挖掘其实是一类深层次的数据分析方法。从这个角度数据挖掘也可 以描述为:按企业制定的业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知 的规律性,并进一步将其模型化的先进有效的方法。
二、 数据挖掘技术
数据挖掘技术是人们长期对数据库技术进行研究和开发的结果,代写论文其屮数据仓库技术的发展与数据 挖掘有着密切的关系。大部分情况下,数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中, 因为数据仓库会对数据进行清理,并会解决数据的不一致问题,这会给数据挖掘带来很多好处。此外数据 挖掘还利用
了人工智能(AI)和统计分析的进步所带来的好处,这两门学科都致力于模式发现和预测。数据库、人工智 能和数理统计是数据挖掘技术的三大支柱。由于数据挖掘所发现的知识的不同,其所利用 的技术也有所不同。
广义知识。指类别特征的概括性描述知识。根据数据的微观特性发现其表征的、带有普遍性的、较高层 次概念的、中观和宏观的知识,反映同类事物的共同性质,是对数据的概括、精炼和抽象。广义知识的发 现方法和实现技术有很多,如数据立方体、面向矚性的归约等。数据立方体的基本思想是实现某些常用的 代价较高的聚集函数的计算,诸如计数、求和、平均、最大值等,并将这些实现视图储存在多维数据库中。 而面向属性的归约是以类SQL语言来表示数据挖掘査询,收集数据库中的相关数据集,然后在相关数据集 上应用•系列数据推广技术进行数据推广,包括属性删除、概念树提升、属性阈值控制、计数及其他聚集 函数传播等。
关联知识。它反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联,那 么其中一项的属性值就可以依据其他属性值进行预测。最为著名的关联规
则发现方法是Apriori算法和FP-Growth算法。关联规则的发现可分为两步:第 涉是迭代识别所有的频 繁项日集,要求
频繁项目集的支持率不低于用户设定的最低值;第二步是从频繁项目集屮构造可信度不低于用户设定的最 低值的规则。识别或发现所有频繁项目集是关联规则发现算法的核心,也是计算量最大的部分。
分类知识。它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。分类方法有决策 树、朴素贝叶斯、神经网络、遗传算法、粗糙集方法、模糊集方法、线性回归和K-Mea

数据挖掘技术及其应用 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人蓝天
  • 文件大小88 KB
  • 时间2021-06-24