下载此文档

数据挖掘考试题.docx

文档分类：IT计算机 | 页数：约9页举报非法文档有奖

1/9

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/9 下载此文档

文档列表 文档介绍

Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】
数据挖掘考试题
数据挖掘考试题
选择题
1. 当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离？( )

2. ( )将两个簇的邻近度定义为不同簇的所有点对邻近度的平均值，它是一种凝聚层次聚类技术。
(单链) (全链)
“啤酒与尿布试验”最主要是应用了( )数据挖掘方法。
A 分类 B 预测 C关联规则分析 D聚类
，以下说法不正确的是( )
，而DBSCAN一般聚类所有对象。
，DBSCAN使用基于密度的概念。
，DBSCAN可以处理不同大小和不同形状的簇
，即便簇有重叠也可以发现，但是DBSCAN会合并有重叠的簇
’s Method说法错误的是：( )

，两个簇的邻近度定义为两个簇合并时导致的平方误差
，Ward方法与组平均非常相似
下列关于层次聚类存在的问题说法正确的是：( )
具有全局优化目标函数
Group Average擅长处理球状的簇
可以处理不同大小簇的能力
Max对噪声点和离群点很敏感
，说法错误的事：( )
，该操作就不能撤销

{牛奶，尿布}→{啤酒}的支持度和置信度分别为：( )
TID
项集
1
2
3
4
5
{面包，牛奶}
{面包，尿布，啤酒，鸡蛋}
{牛奶，尿布，啤酒，可乐}
{面包，牛奶，尿布，啤酒}
{面包，牛奶，尿布，可乐}
( )是属于分裂层次聚类的方法。
Average
，簇间相似度使用MAX计算，第二步是哪两个簇合并：( )
{3}和{l,2}合并 B.{3}和{4,5}合并 C.{2,3}和{4,5}合并
D. {2,3}和{4,5}形成簇和{3}合并
填空题：
属性包括的四种类型：、、、。
是两个簇的邻近度定义为不同簇的所有点对邻近度的平均值。
3. 基本凝聚层次聚类算法空间复杂度，时间复杂度，如果某个簇到其他所有簇的距离存放在一个有序表或堆中，层次聚类所需要的时间复杂度将为。
4.

数据挖掘考试题来自淘豆网www.taodocs.com转载请标明出处.