华南理工大学计算机科学与工程学院 2012 — 20 13 学年度第二学期期末考试《数据仓库与数据挖掘技术》试卷( 假的) 专业:计算机科学与技术年级: 2010 姓名: 学号: 注意事项: 1. 本试卷共四大题,满分 100 分,考试时间 120 分钟; 2. 所有答案请直接答在试卷上; 题号一二三四总分得分一. 填空题(每空 1 分,共 20分) 、___ 集成_________ 、__时变_________ 和非易失性。 、__雪花形模式__________ 、___ 事实星座形模式________ 。 、_OLAP 服务器________ 、__前端客户__________ 为数据仓库的多层结构。 技术多维分析过程中,多维分析操作包括__上卷___ 、__下钻____ 、___ 切片____ 、__切块__________ 、__转轴_________ 等。 :数据清理、__数据集成__________ 、__数据选择___ 、数据交换、_数据挖掘________ 、___ 模式评估_________ 、__知识表示_______ 。 6. 数据仓库的视图的分类有: 自顶向下视图、_ 数据源视图________ 、数据仓库视图、_商务视图_________ 。二. 简答题(每题 6分,共 42分) 。 1、忽略该记录 2、手工填写空缺值 3、使用默认值 4、使用属性平均值 5、使用同类样本平均值 6、使用最可能的值 。 1、概念/类描述:特征化和区分 2、挖掘频繁模式、关联和相关 3、分类和预测 4、聚类分析 5、离群点分析 6、演变分析 OLTP 与OLAP 及他们的主要区别。联机事务处理 OLTP (on-line transaction processing) ;联机分析处理 OLAP (on-line analytical processing) ; OLTP 和 OLAP 的区别: 用户和系统的面向性:OLTP 面向顾客,而 OLAP 面向市场; 数据内容: OLTP 系统管理当前数据,而 OLAP 管理历史的数据; 数据库设计: OLTP 系统采用实体- 联系( ER) 模型和面向应用的数据库设计, 而 OLAP 系统通常采用星形和雪花模型; 视图: OLTP 系统主要关注一个企业或部门内部的当前数据,而 OLAP 系统主要关注汇总的统一的数据; 访问模式: OLTP 访问主要有短的原子事务组成,而 OLAP 系统的访问大部分是只读操作,尽管许多可能是复杂的查询。 ? 数据预处理对于数据仓库和数据挖掘都是一个重要的问题,因为现实中的数据多半是不完整的、有噪声的和不一致的。数据预处理包括数据清理、数据集成、数据交换和数据规约。 ? 使得操作数据库与数据仓库都获得高性能 DBMS —OLTP: 访问方法,索引,并发控制,数据恢复。 Warehouse —OLAP: 复杂 OLAP 查询,多维视图,整理。对数据与功能的要求不同:丢失的数据:决策支持需要历
数据挖掘期末考题(答案) 来自淘豆网www.taodocs.com转载请标明出处.