下载此文档

决策树建模.ppt


文档分类:IT计算机 | 页数:约44页 举报非法文档有奖
1/44
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/44 下载此文档
文档列表 文档介绍
决策树建模
第1页,共44页,编辑于2022年,星期五
§ 数据分类介绍
分类是数据挖掘的一个重要课题, 它的目的是:
构造一个分类函数或分类模型, 该模型能把数据库中的数据项映射到给定类别中的某一个。
数据分类又称为窗口)形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外 加入到窗口中,重复该过程一直到形成正确的决策集。
最终结果是“一棵树”,其叶节点是类名,中间节点是 带有分枝的属性,该分枝对应 该属性的某一可能值。
第15页,共44页,编辑于2022年,星期五
决策树的基本知识-2
决策树通常有两大类型,分别为分类决策树和 回归决策树。
分类决策树用来实现对定类或定序目标变量的分类, 回归决策树则完成对定距目标变量取值的预测。
根据决策树各种不同的属性,可分为以下几类:
决策树内节点的测试属性可能是单变量的,即每个内节点只包含一个 属性; 也可能是多变量的,既存在包含多个属性的内节点。
测试属性的不同属性值的个数,可能使得每个内节点有两个或多个 分枝。如果一棵决策树每个内节点只有两个分枝则称之为二叉 决策树,如由CART算法生成的决策树。
每个属性可能是值类型(连续值),也可能是枚举类型(离散值)。
分类结果既可能是两类也有可能是多类,如果二叉决策树的结果只有 两类,则称之为布尔决策树。
第16页,共44页,编辑于2022年,星期五
决策树的基本知识-2
决策树学****是应用最广的归纳推理算法之一。它是一种逼近离散函数值的方法,分类精度高,操作简单,并且对噪声数据有很好的稳健性,因而成为比较实用且比较流行的数据挖掘算法。
它的最大优点是,在学****过程中不需要使用者了解很多背景知识,只要训练样本集能够用“属性-值”的方式表达 出来就能使用决策树学****算法来分类。
第17页,共44页,编辑于2022年,星期五
决策树的基本知识-2
决策树方法的(相对)优点:
可以生成可理解的规则 数据挖掘产生的模式的可理解度是判别数据挖掘算法的主要指标之一,相比于一些数据挖掘算法,决策树算法产生的规则比较容易理解,并且决策树模型的建立过程也很直观。
计算量较小。
可以处理连续和集合属性。
决策树的输出包含属性的排序 生成决策树时,按照最大信息增益选择测试属性, 因此,在决策树中可以大致判断属性的相对重要性。
第18页,共44页,编辑于2022年,星期五
决策树的基本知识-2
决策树方法的缺点:
对于具有连续值的属性预测比较困难。 -
对于顺序相关的数据,需要很多预处理的工作。
当类别太多时,通常会增加误差
分枝间的拆分不够平滑,进行拆分时,不考虑其对将来拆分的影响。
缺值数据处理问题: 因为决策树进行分类预测时,完全基于数据的测试属性,所以对于测试属性缺失的数据,决策树将无法处理。
通常仅根据单个属性来分类: 决策树方法根据单个属性对数据进行 分类,而在实际的分类系统中,类的划分不仅仅与单个属性有关,往往与一个属性集有关。因此,将决策树算法推广到考虑多属性 是一个有待研究的课题。
第19页,共44页,编辑于2022年,星期五
决策树的基本知识-2
决策树学****算法适用的问题:
样本可以用“属性-值”的方式来描述
目标函数的输出值为离散值
训练数据中允许包含有错误: 样本的分类错误或属性值错误都允许
训练数据中有样本属性值缺失
第20页,共44页,编辑于2022年,星期五
§ 决策树介绍-2
决策树的应用和发展趋势
决策树由于结构简单、效率高等优点而获得了广泛的应用。在国外,决策树在商业、工业、天文、医学、风险分析、社会科学和分类学等领域的应用已经取得了很好的经济和社会效益。 国内目前有关决策树的研究多是围绕算法的改进以及决策树在商业、工业等领域的运用。
在商业领域,决策树方法所能解决的典型商业问题有:客户关系 管理、数据库营销、客户群体划分、交叉销售等市场分析 行为,以及客户流失分析、客户信用计分及欺诈发现,等等。
在工业领域,决策树可以用于故障诊断、工业生产过程控制等。
在医学领域,决策树方法可用于疾病诊断治疔、 基因与高分子序列分析、医院信息系统挖掘及医疗政策分析等。
第21页,共44页,编辑于2022年,星期五
§ 树的建模过程
第22页,共44页,编辑于2022年,星期五
§ 树的建模过程
决策树算法通过构造决策树来发现数据中蕴涵的分类规则,包含许多种不同的算法,主要可以分为三类:
(1)基于统计学理论的方法,以CART为代表,在这类算法中,对于非终端节点来说,有两个分枝

决策树建模 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数44
  • 收藏数0 收藏
  • 顶次数0
  • 上传人石角利妹
  • 文件大小2.30 MB
  • 时间2022-04-25