下载此文档

数据挖掘技术.doc


文档分类:IT计算机 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
数据挖掘技术摘要随着社会的进步,数据信息量的增加,人们对数据信息有了更高的要求。本文从数据挖掘技术定义, 常用的技术方法以及数据挖掘的应用做了简单的介绍, 最后介绍了对数据挖掘技术的展望。关键词数据挖掘;方法;应用中图分类号 tp3 文献标识码 a 文章编号 1674 — 6708 ( 2012 ) 76— 0209 — 02 近几年来, 随着数据库技术的不断发展, 数据挖掘引起了信息产业界和整个社会的极大关注。因为人们所拥有的数据量在不断的增长, 这就对数据的管理和分析提出了更高的要求, 急需新的技术从大量的信息中提取或“挖掘”知识,于是数据挖掘( data mining ) 技术被受人们关注和使用。 1 数据挖掘技术定义数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在大多数情况下,人们只知道储存数据, 数据越来越多, 可是不知道数据中存有很多重要的信息, 数据挖掘就可以从这大量的数据中搜索出重要的信息。 2 数据挖掘常用的方法 1 )决策树。决策树方法是把数据分类,构成测试函数,建立树每一层分支, 重复下去就构成了决策树。在构造决策树时, 树尽可能精度高,规模小。商业银行在对风险决策时经常用此方法; 2 )人工神经网络。神经网络方法引用生物神经网络的方法,就好像人的神经网络, 它连接输入、输出信号的枢纽。它在很大程度上模拟人脑的神经系统处理信息。人工神经网络具有四个基本特征: 非线性、非局限性、非常定性、非凸性。用人工神经网络方法建立的模型具有很强的非线性拟合能力, 学****规则简单, 控制能力强等优点; 3 )遗传算法( ic algorithm , ga) 。遗传算法是模仿达尔文生物进化的自然选择和遗传机制的一种寻优算法。群体中的所有个体为研究对象,利用随机化技术搜索编码,然后分别利用选择、交叉和变异这三个基本遗传算子对其进行遗传操作就能寻找到问题的最优解或者是最满意解。遗传算法的优点是过程简单, 具有随机性, 可扩展性。实用。在很多领域得到了很大的应用。缺点是编程比较复杂, 需要对问题进行编码, 找到满意解后还要对问题解码。算法速度比较慢,对初始种群的选择有依赖性等缺点; 4 )聚类算法。聚类算法可以说是多元统计研究“物以类聚,人以群分”的一种方法,主要任务是发现大型数据中的积聚现象。聚类分析是把相似特征的样本归为一类, 类内差异差距较小, 类间距差距较大。聚类算法在好多领域有应用。在商务上, 根据客户不同的消费模式进行分类,对客户进行划分,帮助商家获得更多利益。在生物学中, 对动植物进行分类, 了解各自的基因特征。聚类的算法也比较多,例如:基于模糊的聚类方法、基于粒度的聚类方法、量子聚类、核聚类、谱聚类, 这些是新发展的聚类算法。还有常用的聚类算法— birch 算法、 k— means 算法、均值计算方法等。 3 数据挖掘的应用数据挖掘技术在好多领域有应用。例如:金融业、通讯、教育、政府管理部门等等行业。 1 )金融业。例如:金融事务需要搜集和处理大量复杂的数据, 许多银行和金融机构提供多种多样的投资服务(如共同基金) 、信用服务(如个人信用卡)和银行服务(如个人存款) 。由于交易的频繁性、信息的不对称性和复杂性,必须从海量数据中挖掘信息, 金融数据挖

数据挖掘技术 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人xxj16588
  • 文件大小0 KB
  • 时间2016-06-07