摘要
曰曰曰曰日日日曰日
摘要
当今科学技术的飞速发展,使得数据库的规模日益扩大,存储的数据量急剧
增加。因而,迫切需要有新的、更为有效的技术和工具对各种数据信息资源进行
开采以发挥其应用潜能。知识发现和数据挖掘技术正是在这样的应用需求背景下
产生并随着决策系统的推动而发展的。本文从系统工程进行决策分析的角度出
发,借助数据挖掘技术中粗糙集的基本理论,在智能决策框架的指导下,研究了
基于数据挖掘的智能决策理论及方法。主要理论包括①如何利用粗糙集对典型
的决策系统即相容性决策系统和不相容性决策系统运用不同的数据挖掘方法进
行有效的数据约减和规则提取②在增量动态的数据库环境下讨论了在典型决策
系统中对原始数据和增量数据进行数据约减的方法③分析了带有优先权属性的
粗糙集数据挖掘方法④以基本粗糙集为基础探讨了粗糙集扩展模型的数据分析
方法⑤研究了粗糙集数据预处理方法。主要研究工作及创新如下
将决策系统分为相容性和不相容性决策系统,针对不同系统的特点提出
不同的挖掘模型。
对相容性决策系统从两个角度作为启发式信息对条件属性进行数据约减。第
一种方法利用了知识的不可分辨性,并以逻辑推演的方式对决策表进行数据浓
缩第二种方法利用了知识的粒度,并以概念的提升方式对决策表进行数据浓缩。
在不相容决策系统中提出了两种改进算法即决策概念包含法和粗糙重复组法对
不相容的决策系统挖掘出具有一定可信度的分类规则。
在增量式动态数据库中,提出了相容性和不相容性决策系统的数据挖掘
模型,
在相容性决策系统中,利用决策矩阵提出改进的处理多元决策属性值的数据
挖掘模型,可方便地对增量的数据进行直接处理就可得到基于全局数据集合的分
类规则,并对可能性规则的可信度进行了初步探讨在不相容性决策系统中,利
用表与概念的结合,提出利用三个参数即归纳强度、噪声、隶属度判
别指标确定分类规则的强度,通过属性的概念归纳,在一定的概率条件下产生分
类规则,并能有效地处理增量式的数据。
针对条件属性的等价关系和优先二元关系特性,提出了改进的带有优先
权属性的粗糙集数据挖掘模型。
论文在粗糙集拓广理论的基础上,利用属性的有序特性即优先二元关系,提
出有序属性的数据挖掘改进算法,使基本粗糙集和带有准则的粗糙集在挖掘分类
精度上达到统一,且挖掘出的规则简练、更具合理性和综合性。
建立了粗糙集与概率统计和模糊理论的拓展模型。
利用数据的统计特征,将概率测度与分类规则结合起来,提出了相应的知识
西北工业大学博士学位论文
约减算法利用模糊属性集合的特点,把粗糙集合与模糊集合有机结合起来,将粗
糙集中分辨矩阵的思想引入到具有隶属度属性的隐式决策系统中进行数据约减。
利用数据的分布特征,提出了一种改进的领域独立的数据预处理模型。
该模型利用统计值测度进行属性离散化,并提出了对条件属性值的分段
间隔首先进行初始化分段算法,使其之后的归并工作大大减少,并以不一致性水
平闭值作为停机条件,提高了离散化速度。
将本文理论部分提出的数据挖掘核心模型应用到电信的客户挖掘中。
将本文提出的数据挖掘核心模型应用于电信的客户挖掘中,主要对电
信中的客户行为进行了分组,提出了大客户识别和划分的依据,初步验证
了论文相关方法的正确性和有效性。
【关键词】知识发现,数据挖掘,决策表,智能决策,分类规则,属性离散化
知识水坝为您整理
摘要
曰口曰
阮
,
知识水坝为您整理
西北工业大学博士学位论文
第章绪论
第章绪论
引言
当今计算机和网络通讯技术的飞跃发展使得各个领域的信息正在急剧增
长,信息爆炸或信息泛滥是当今数字化社会面临的一个巨大挑战。商业上对条形
码的普遍使用使得很多行业每天都积累了大量数据、科学上对先进的现代观测仪
器的使用导致每天产生巨量的数据、的迅猛发展使得网络上的各种资源
信息异常丰富。面对数据和数据库的飞速发展,人们迫切的感到需要新的技术和
工具以便从大量的数据中智能地、自动地抽取出有价值的知识或信息,从而能辅
助人们进行有效地、智能地、可靠地、全面地决策。知识发现技术于
是应运而生。由于蕴藏知识的信息大多存储于数据库中,数据库中的知识发现,
又称数据挖掘成为当今知识发现的主要研究课题
从大量数据中发现知识一般可分为两个方面其一是与科学发现相关,即从
观测客观世界的大量实验数据中发现数据的整体结构特征和数据间的函数关系,
基于数据挖掘的智能决策研究(可复制论文) 来自淘豆网www.taodocs.com转载请标明出处.