维普资讯
吴湘洲田盛丰
蔓: 绍了通用数据挖掘置型系藐中升类挖曩模块设计与实琨。系统中升类挖掘采用耗
,弪其在
系统馒计与实瑰。
关鼍胃:羲据挖曩升类决策捌.
鲫,枷蚤
: .
.. .·
.
. ..
; :.
引言数据挖掘系统已。“
近几年来,随着数据库技术的迅速发展和管理系统的数据挖掘系统的输入是数据库或数据仓库的数
广泛应用,人们积累的数据越来越多。数据的背后隐藏着据、信息分析员的指导以及存储在挖掘系统知识库中的知
, 识和规则。
以便更好地利用这些数据。目前的数据库系统可以高效地式和关系。然后进行评价,通过与分析员交互以期发现令
实现数据的录入、修改、统计、查询等功能,但无法发人感兴趣的模式。有些发现还要加入知识库中,以便后继
现数据中存在的关系和规则,无法根据现有的数据预测未的抽取并进行评价。数据挖掘系统由以下构件联合组成:
来的发展趋势。
致了“数据爆炸但知识贫乏”的现象。数据挖掘和知识
发现技术应运而生,
示出其强大的生命力。
是从数据集中识别出有效的、新颖的、潜在的、
有用的以及最终可理解模式的高级处理过程。数据挖掘是
的核心部分。数据挖掘是近几年人
工智能和数据数据库技术研究的热点。数据挖掘就是从大图数据挖掘逻辑模壅
量的数据中抽取以前未知并具有潜在可用的模式。数据挖
掘技术表现出的广阔的应用前景吸引了众多的研究人员和商数据挖掘系统简介
业机构,一批数据挖掘系统被开发出来,并在商业、经我们开发的通用数据挖掘系统是基于数据库
济、金融、管理等领域都取得了应用性成果。上的。系统主要由大模块组成,包括数据接口、数据离
我们开发的通用数据挖掘系统是基于数据库散化、关联规则挖掘、分类挖掘及结果可视化。
的。本系统主要由五太模块组成,包括数据接口、
离散化、关联规则挖掘、分类挖掘及结果可视化。本文提供本原型系统和数据库访同接口。
重点介绍分类挖掘模块的设计和实现。.数据预处理
本模块的目的是对原始数据进行处理,生成数据挖掘
吴湘洲北方交太工智能实验室硕士研究生北京市
田盛丰北方交大工智能实验室教授北京市工具可利用的数据。
—而丽
维普资讯
.关联规则挖掘模块标记已测试过的属性;
包括若干种关联分析模型的工具对每一个≤≤,用和新的属性表调用
.分类规则挖掘模块生成的决策树;
分类分析模型建造工具的实现,决策树法。本返回以,,⋯,为子树的决策树。
文重点讨论此部分。此处信息增益和信息增益比是熵的函数,熵表示平均
.结果可视化模块信息量。通过此函数评价使用各属性进行分类获得的信息
对挖掘结果进行解释评估,给出各种直观的图形化显量,选择一个获得信息最大的用于分类,提高分类效率。
示方法。.算法是算法的改进,算法在算法的
原型基础之上介绍了大量的扩展。.算法在以下几个方
分类挖掘模块的设计和实现。面提高了算法的性
数据挖掘原型系统中分类挖掘模块设计与实现.pdf 来自淘豆网www.taodocs.com转载请标明出处.