下载此文档

数据挖掘考试题.docx


文档分类:IT计算机 | 页数:约9页 举报非法文档有奖
1/9
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/9 下载此文档
文档列表 文档介绍
: .
数据挖掘考试题

1. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离?()
A. 分类
2. ()将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类 技术。
A. MIN(单链) (全链)
3. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了()数据挖掘方法。
A分类 B预测 C关联规则分析 D聚类
4. 关于K均值和DBSCAN的比较,以下说法不正确的是()
A. K均值丢弃被它识别为噪声的对象,而DBSCAN 一般聚类所有对象。
B. K均值使用族的基于原型的概念,DBSCAN使用基于密度的概念。
C. K均值很难处理非球形的簇和不同大小的族,DBSCAN可以处理不同大小和不同形状的 簇
D. K均值可以发现不是明显分离的族,即便族有重叠也可以发现,但是DBSCAN会合并有 重叠的簇
5. 下列关于Ward's Method说法错误的是:()
A. 对噪声点和离群点敏感度比较小
B. 擅长处理球状的簇
C. 对于Ward方法,两个簇的邻近度定义为两个簇合并时导致的平方误差
D. 当两个点之间的邻近度取它们之间距离的平方时,Ward方法与组平均非常相似
6. 下列关于层次聚类存在的问题说法正确的是:()
A. 具有全局优化目标函数
B. Group Average擅长处理球状的簇
C. 可以处理不同大小箴的能力
D. Max对噪声点和离群点很敏感
7. 下列关于凝聚层次聚类的说法中,说法错误的事:()
A. 一旦两个簇合并,该操作就不能撤销
B .算法的终止条件是仅剩下一个簇
")

8. 规则{牛奶,尿布}-{啤酒}的支持度和置信度分别为:()
TID
项 集
1
{面包,牛奶}
2
{面包,尿布,啤酒,鸡蛋}
3
{牛奶,尿布,啤酒,可乐}
4
{而包,牛奶,尿布,啤酒}
5
{面包,牛奶,尿布,可乐}
A. , , ,
9. 下列()是属于分裂层次聚类的方法。
Average
10. 对下图数据进行凝聚聚类操作,簇间相似度使用MAX计算,第二步是哪两个簇合并:()
11
I2
I3
I4
I5
11





I2





I3





I4





I5





{3}和{1,2}合并 B.{3}和{4,5}合并 C.{2,3}和{4,5}合并
D. {

数据挖掘考试题 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数9
  • 收藏数0 收藏
  • 顶次数0
  • 上传人秋江孤影
  • 文件大小33 KB
  • 时间2021-08-14