下载此文档

数据仓库的管理和应用.ppt


文档分类:IT计算机 | 页数:约65页 举报非法文档有奖
1/65
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/65 下载此文档
文档列表 文档介绍
第 5 章
数据仓库的管理与应用
1
内容提要
数据仓库管理
数据仓库的决策支持与决策支持系统
数据仓库应用实例
2
数据仓库管理
用户使用数据仓库的管理
数据管理
3
为什么需要对数据仓库进行管理?
数据仓库中的数据也会随时间的延伸迅速的增长。
(1)数据仓库收集历史数据。
(2)数据仓库包含满足未知需求的数据集。
(3)数据仓库既包括了详细数据也包括了汇总数据。
(4)数据仓库还包含外部数据。
4
用户使用数据仓库的管理
1. 信息使用者使用数据仓库的性能优化
2. 探索者使用数据仓库的性能优化
5

非规格化
创建数据阵列
预连接表格
预聚集数据
聚类数据
压缩数据
定期净化数据
合并查询
6

(1)概括分析
分析数据的完整性和准确性(数据质量)。
(2)抽取
数据抽取的任务就是从数据仓库中抽取指定的数
据,并组织起来,送入支持探索者分析的探索仓
库中。
(3)建模
通过概括分析来理解数据,通过抽取来准备数
据,通过建模来分析数据。
7
数据管理
休眠数据
脏数据的产生和清理
监视数据
元数据管理
8
休眠数据
1.休眠数据概念
休眠数据是那些存在于数据仓库中当前不使用,将来也很少使用或不使用的数据。
数据仓库中的数据随着时间的延续,数据被使用的情况会减少,休眠数据随之逐年增加。
9
一些事实:
国外的统计表明:
第1年内,数据仓库近期数据和综合数据几
乎被全部使用。
第2年内,休眠数据开始出现,数据仓库中
的数据不少未被使用。
第3年内,休眠数据在增长。
第4年内,休眠数据迅速增长。
10

数据仓库的管理和应用 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数65
  • 收藏数0 收藏
  • 顶次数0
  • 上传人精品小课件
  • 文件大小284 KB
  • 时间2020-11-25