下载此文档

数据挖掘技术与用户知识获取.doc


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
数据挖掘技术与用户知识获取.doc数据挖掘技术与用户知识获取
【摘要题】实践研究
【正文】
1数据挖掘技术概述
随着信息技术的迅速发展,数据库的规模不断扩大,从而产 生了大量的数据。为给决策者提供一个统一的全局视角,在许多领域 建立了数据仓库。但大量的数据往往使人们无法辨别隐藏在其中的能 对决策提供支持的信息,而传统的查询、报表工具无法满足挖掘这些 信息的需求。因此,需要一种新的数据分析技术处理大量数据,并从 中抽取有价值的潜在知识,数据挖掘(DataMining)技术由此应运而 生。数据挖掘技术也正是伴随着数据仓库技术的发展而逐步完善起来 的。
数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有 用信息的非平凡过程,这些信息的表现形式为:规则、概念、规律及 模式等。它可帮助决策者分析历史数据及当前数据,并从中发现隐藏 的关系和模式,进而预测未来可能发生的行为。数据挖掘的过程也叫 知识发现的过程,它是一门涉及面很广的交叉性新兴学科,涉及到数 据库、人工智能、数理统计、可视化、并行计算等领域。数据挖掘是 一种新的信息处理技术,其主要特点是对数据库中的大量数据进行抽 取、转换、分析和其他模型化处理,并从中提取辅助决策的关键性数 据。数据挖掘是 KDD (KnowledgeDiscoveryinDatabase)中的重要技
术,它并不是用规范的数据库查询语言(如SQL)进行查询,而是对 查询的内容进行模式的总结和内在规律的搜索。传统的查询和报表处 理只是得到事件发生的结果,并没有深入研究发生的原因,而数据挖 掘则主要了解发生的原因,并且以一定的置信度对未来进行预测,用 来为决策行为提供有利的支持。
2数据挖掘的常用技术
机器学****数理统计等方法是数据挖掘进行知识学****的重要 方法。数据挖掘算法的好坏将直接影响到所发现知识的好坏,目前对 数据挖掘的研究也主要集中在算法及其应用方面。统计方法应用于数 据挖掘主要是进行数据评估;机器学****是人工智能的另一个分支,也 称为归纳推理,它通过学****训练数据集,发现模型的参数,并找出数 据中隐含的规则。其中关联分析法、人工神经元网络、决策树和遗传 算法在数据挖掘中的应用很广泛。
1) 关联分析法。从关系数据库中提取关联规则是几种主要的 数据挖掘方法之一。挖掘关联是通过搜索系统中的所有事物,并从中 找到出现条件概率较高的模式。关联实际上就是数据对象之间相关性 的确定,用关联找出所有能将一组数据项和另一组数据项相联系的规 则,这种规则的建立并不是确定的关系,而是一个具有一定置信度的 可能值,即事件发生的概率。关联分析法直观、易理解,但对于关联 度不高或相关性复杂的情况不太有效。
2)
人工神经元网络(ANN),是数据挖掘中应用最广泛的技术。 神经网络的数据挖掘方法是通过模仿人的神经系统来反复训练学****数 据集,从待分析的数据集中发现用于预测和分类的模式。神经元网络 对于复杂情况仍能得到精确的预测结果,而且可以处理类别和连续变 量,但神经元网络不适合处理高维变量,其最大的缺点是不透明性, 因为其无法解释结果是如何产生的,及其在推理过程中所用的规则。 神经元网络适合于结果比可理解性更重要的分类和预测的复杂情况, 可用于聚类、分类和序列模式。
3) 决策树(DT)是一种树型结构的预测模型,其中树的非终 端节点表示属性,叶节点表示所属的

数据挖掘技术与用户知识获取 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人蓝天
  • 文件大小88 KB
  • 时间2021-06-24