第 5 章
数据仓库的管理与应用
1
内容提要
数据仓库管理
数据仓库的决策支持与决策支持系统
数据仓库应用实例
2
数据仓库管理
用户使用数据仓库的管理
数据管理
3
为什么需要对数据仓库进行管理?
数据仓库中的数据也会随时间的延伸迅速的增长。
(1)数据仓库收集历史数据。
(2)数据仓库包含满足未知需求的数据集。
(3)数据仓库既包括了详细数据也包括了汇总数据。
(4)数据仓库还包含外部数据。
4
用户使用数据仓库的管理
1. 信息使用者使用数据仓库的性能优化
2. 探索者使用数据仓库的性能优化
5
非规格化
创建数据阵列
预连接表格
预聚集数据
聚类数据
压缩数据
定期净化数据
合并查询
6
(1)概括分析
分析数据的完整性和准确性(数据质量)。
(2)抽取
数据抽取的任务就是从数据仓库中抽取指定的数
据,并组织起来,送入支持探索者分析的探索仓
库中。
(3)建模
通过概括分析来理解数据,通过抽取来准备数
据,通过建模来分析数据。
7
数据管理
休眠数据
脏数据的产生和清理
监视数据
元数据管理
8
休眠数据
1.休眠数据概念
休眠数据是那些存在于数据仓库中当前不使用,将来也很少使用或不使用的数据。
数据仓库中的数据随着时间的延续,数据被使用的情况会减少,休眠数据随之逐年增加。
9
一些事实:
国外的统计表明:
第1年内,数据仓库近期数据和综合数据几
乎被全部使用。
第2年内,休眠数据开始出现,数据仓库中
的数据不少未被使用。
第3年内,休眠数据在增长。
第4年内,休眠数据迅速增长。
10
数据仓库的管理和应用 来自淘豆网www.taodocs.com转载请标明出处.