下载此文档

数据挖掘考试题.doc


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
.
精选文档.
数据挖掘考试题
选择题
1. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( )
2. ( )将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值,它是一种凝聚层次聚类技术。
“啤酒与尿布试验”最主要是应用了( )数据挖掘方法。
A 分类 B 预测 C关联规则分析 D聚类
,以下说法不正确的是( )
,而DBSCAN一般聚类所有对象。
,DBSCAN使用基于密度的概念。
,DBSCAN可以处理不同大小和不同形状的簇
,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
’s Method说法错误的是:( )
,两个簇的邻近度定义为两个簇合并时导致的平方误差
,Ward方法与组平均非常相似
下列关于层次聚类存在的问题说法正确的是:( )
具有全局优化目标函数
Group Average擅长处理球状的簇
可以处理不同大小簇的能力
Max对噪声点和离群点很敏感
,说法错误的事:( )
,该操作就不能撤销
.
精选文档.
{牛奶,尿布}→{啤酒}的支持度和置信度分别为:( )
TID
项 集
1
2
3
4
5
{面包,牛奶}
{面包,尿布,啤酒,鸡蛋}
{牛奶,尿布,啤酒,可乐}
{面包,牛奶,尿布,啤酒}
{面包,牛奶,尿布,可乐}
( )是属于分裂层次聚类的方法。
,簇间相似度使用MAX计算,第二步是哪两个簇合并:( )
{3}和{l,2}合并 B.{3}和{4,5}合并 C.{2,3}和{4,5}合并
D. {2,3}和{4,5}形成簇和{3}合并
填空题:
属性包括的四种类型: 、 、 、 。
是两个簇的邻近度定义为不同簇的所有点对邻近度的平均值。
3. 基本凝聚层次聚类算法空间复杂度 ,时间复杂度 ,如果某个簇到其他所有簇的距离存放在一个有序表或堆中,层次聚类所需要的时间复杂度将为 。
4. 聚类中,定义簇间的相似度的方法有(写出四个): 、 、 、 。
.
精选文档.
5. 层次聚类技术是第二类重要的聚类方法。两种层次聚类的基本方法: 、 。
6. 组平均是一种界于 和 之间的折中方法。
7. 相似度矩阵可以用相识度表示还可以用 表示。
8. 全链在处理大小不同的簇时,可能使 破裂

数据挖掘考试题 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人相惜
  • 文件大小90 KB
  • 时间2021-10-08