下载此文档

决策树方法应用实例.ppt


文档分类:IT计算机 | 页数:约15页 举报非法文档有奖
1/15
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/15 下载此文档
文档列表 文档介绍
该【决策树方法应用实例 】是由【977562398】上传分享,文档一共【15】页,该文档可以免费在线阅读,需要了解更多关于【决策树方法应用实例 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。解:由题意可知:
s=14,类标号属性“购买电脑”有两个不同值(即{会购买,不会购买}),因此有两个不同的类(即m=2)。设类C1对应于“会购买”,类C2对应于“不会购买”。则s1=9,s2=5,p1=9/14,p2=5/14。
①计算对给定样本分类所需的期望信息:
②计算每个属性的熵。
先计算属性“年龄”的熵。
对于年龄=“<=30”:s11=2,s21=3,p11=2/5,p21=3/5,
对于年龄=“31…40”:s12=4,s22=0,p12=4/4=1,p22=0,
第一页,共15页。
对于年龄=“>40”:s13=3,s23=2,p13=3/5,p23=2/5,
如果样本按“年龄”划分,对一个给定的样本分类所需的期望信息为:
因此,这种划分的信息增益是
Gain(年龄)=I(s1,s2)-E(年龄)=。
计算“收入”的熵。
对于收入=“高”:s11=2,s21=2,p11=,p21=,
对于收入=“中等”:s12=4,s22=2,p12=4/6,p22=2/4,
第二页,共15页。
对于收入=“低”:s13=3,s23=1,p13=3/4,p23=1/4,
如果样本按“收入”划分,对一个给定的样本分类所需的期望信息为:
因此,这种划分的信息增益是
Gain(收入)=I(s1,s2)-E(收入)=-=。
计算“学生”的熵。
对于学生=“是”:s11=6,s21=1,p11=6/7,p21=1/7,
第三页,共15页。
对于学生=“否”:s12=3,s22=4,p12=3/7,p22=4/7,
如果样本按“学生”划分,对一个给定的样本分类所需的期望信息为:
因此,这种划分的信息增益是
Gain(学生)=I(s1,s2)-E(学生)=-=。
计算“信用等级”的熵。
对于信用等级=“一般”:s11=6,s21=2,p11=6/8,p21=2/8,
对于信用等级=“良好”:s12=3,s22=3,p12=3/6,p22=3/6,
第四页,共15页。
如果样本按“信用等级”划分,对一个给定的样本分类所需的期望信息为:
因此,这种划分的信息增益是
Gain(信用等级)=I(s1,s2)-E(信用等级)=-=。
由于“年龄”属性具有最高信息增益,它被选作测试属性。创建一个节点,用“年龄”标记,并对每个属性值引出一个分支。样本据此划分,如图所示。
第五页,共15页。
收入
学生
信用等级



一般
会购买


良好
会购买
中等

良好
会购买


一般
会购买
收入
学生
信用等级



一般
不会购买


良好
不会购买
中等

一般
不会购买


一般
会购买
中等

良好
会购买
收入
学生
信用等级

中等

一般
会购买


一般
会购买


良好
不会购买
中等

一般
会购买
中等

良好
不会购买
<=30
31…40
>40
年龄
第六页,共15页。
收入
学生
信用等级



一般
不会购买


良好
不会购买
中等

一般
不会购买


一般
会购买
中等

良好
会购买
表1年龄<=30
当年龄<=30时,对应于表1。S=5,设类C1对应于“会购买”,类C2对应于“不会购买”。则s1=2,s2=3,p1=2/5,p2=3/5。
①计算对给定样本分类所需的期望信息:
②计算每个属性的熵。
先计算属性“收入”的熵。
对于收入=“高”:s11=0,s21=2,p11=0,p21=1,
第七页,共15页。
对于收入=“中等”:s12=1,s22=1,p12=1/2,p22=1/2,
对于收入=“低”:s13=1,s23=0,p13=1,p23=0,
如果样本按“收入”划分,对一个给定的样本分类所需的期望信息为:
因此,这种划分的信息增益是
Gain(收入)=I(s1,s2)-E(收入)=-=。
第八页,共15页。
计算“学生”的熵。
对于学生=“是”:s11=2,s21=0,p11=1,p21=0,
对于学生=“否”:s12=0,s22=3,p12=0,p22=1,
如果样本按“学生”划分,对一个给定的样本分类所需的期望信息为:
因此,这种划分的信息增益是
Gain(学生)=I(s1,s2)-E(学生)=-0=。
第九页,共15页。
计算“信用等级”的熵。
对于信用等级=“一般”:s11=1,s21=2,p11=1/3,p21=2/3,
对于信用等级=“良好”:s12=1,s22=1,p12=1/2,p22=1/2,
如果样本按“信用等级”划分,对一个给定的样本分类所需的期望信息为:
因此,这种划分的信息增益是
Gain(信用等级)=I(s1,s2)-E(信用等级)=-=。
第十页,共15页。

决策树方法应用实例 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数15
  • 收藏数0 收藏
  • 顶次数0
  • 上传人977562398
  • 文件大小412 KB
  • 时间2023-03-22