下载此文档

数据挖掘期末考试计算题及答案.doc


文档分类:高等教育 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
题一:
一阶项目集
支持度
a
5
b
4
c
2
d
5
e
3
f
4
g
6
一阶频繁集
支持度
a
5
b
4
d
5
f
4
g
6
二阶候选集
支持度
ab
3
ad
4
af
2
ag
5
bd
3
bf
1
bg
3
df
3
dg
4
fg
3
二阶频繁集
支持度
ad
4
ag
5
dg
4
三阶候选集
支持度
adg
4
三阶频繁集
支持度
adg
4
题二
Distance(G,A)2=; Distance(G,B)2=; Distance(G,C)2=
Distance(G,D)2=; Distance(G,E)2=; Distance(G,F)2=
G的三个最近的邻居为B,F,A,因此G的分类为湖泊水
Distance(H,A)2=; Distance(H,B)2=; Distance(H,C)2=
Distance(H,D)2=; Distance(H,E)2=; Distance(H,F)2=
H的三个最近的邻居为A,D,F,因此H的分类为冰川水
题三
首先计算各属性的信息增益
Gain(Ca+浓度)=0
Gain(Mg+浓度)=
Gain(Na+浓度)=0
Gain(Cl-浓度)=
?
冰川水
Cl-浓度
选择 Cl-浓度作为根节点


计算各属性的信息增益
Gain(Ca+浓度)=0
Gain(Mg+浓度)=
Cl-浓度
冰川水
Gain(Na+浓度)=

?

湖泊水
Mg+浓度


选择Mg+浓度作为节点
计算各属性的信息增益
Gain(Ca+浓度)=
Gain(Na+浓度)=
Cl-浓度


Mg+浓度
冰川水



湖泊水
Na+浓度
冰川水
湖泊水

题四
P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低| 类型=冰川水)*P(冰川水)
=P(Ca+浓度=低| 类型=冰川水)* P(Mg+浓度=高| 类型=冰川水)* P(Na+浓度=高| 类型=冰川水)* P(Cl-浓度=低| 类型=冰川水) *P(冰川水)
=****=
P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低| 类型=湖泊水)*P(湖泊水)
=P(Ca+浓度=低| 类型=湖泊水)* P(Mg+浓度=高| 类型=湖泊水)* P(Na+浓度=高| 类型=湖泊水)* P(Cl-浓度=低| 类型=湖泊水) *P(湖泊水)
=***1*=
第一个样本为冰川水
P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高| 类型=冰川水)*P(冰川水)
=P(Ca+浓度=高| 类型=冰川水)* P(Mg+浓度=高| 类型=冰川水)* P(Na+浓度=低| 类型=冰川水)* P(Cl-浓度

数据挖掘期末考试计算题及答案 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人endfrs
  • 文件大小271 KB
  • 时间2017-10-03
最近更新