下载此文档

数据仓库复习.docx


文档分类:IT计算机 | 页数:约12页 举报非法文档有奖
1/12
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/12 下载此文档
文档列表 文档介绍
1、数据库(原始数据/操作型数据)和数据仓库(导出数据/分析型数据)的区别
操作型数据
分析型数据
细节的
综合的或提炼的
在存取瞬间,数据是准确的
历史数据
可更新
不可更新
事先可知操作需求
操作需求事先不可知
生数据库数据到数据仓库之后及本次将要抽取数据库 数据之前,对数据库分别做一次快照,然后比较两幅快照之间的不同,从而确定需要向数据 仓库追加的数据;
(4) 日志文件;记录变化
15、 数据集市是指针对特定应用的数据仓库,即针对某个具有战略意义的应用或部门级的应 用,支持用户利用已有的数据做出管理决策;
类型:独立(型)数据集市和从属(型)数据集市;
16、 数据仓库系统的层次结构
(1)数据仓库数据库服务器层;(2)OLAP服务器层;(3)客户层;
17、 数据仓库的构造模式
(1)自顶向下模式;(2)自底向上模式;(3)平行开发模式;
18、 操作数据存储(ODS):是用于支持全局应用的数据集合;
ODS中的数据的特点:(1)面向主题的;(2)集成化的;(3)可变的;(4)数据是当前的 或接近当前的;
ODS只存放当前数据或接近当前的数据,而且可以进行联机修改,包括添加、删除、更改等 操作。所谓当前是指数据在存取时刻是最新的,而接近当前指所存取的数据是最近一段时间 之前得到的。虽然数据仓库中数据也是面向主题和集成化的,但通常是不可修改的,所以 ODS与数据仓库之间的区别主要体现在这两方面。
19、 DB-ODS-DW三层体系结构(P36)
原先在数据仓库和业务数据库之间保持数据一致性的工作从DB-DW接口转移到ODS-DB 接口上,原先全部由数据仓库来实现的诸项复杂功能得到了更好的划分,有利于实现产品的 可实现性和可维护性;
ODS的记录在DB中,DW的记录在ODS中;
20、 联机分析处理(OLAP):
定义一:OLAP是针对特定问题的联机数据访问和分析处理;
定义二:OLAP是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信 息,以达到深入理解数据的目的;
OLAP相关概念:
(1) 维:维是人们观察数据的特定角度,是考虑问题时所涉及的一类属性,属性的集合构 成一个维;
(2) 维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度互异的各 个描述层面,称多个描述层面为维的层次;
(3) 维的成员:维的一个取值称为该维的一个成员;
(4) 多维数组:是维和变量的组合表示;
(5) 数据单元(单元格):数据单元是多维数组的取值;
联机事务处理(OLTP)和联机分析处理(OLAP)比较
OLTP数据
OLAP数据
原始数据
导出数据
细节性数据
综合性和提炼性数据
当前值数据
历史数据
数据可更新
数据不可更新,但会被周期性地刷新
一次处理的数据量较小
一次处理的数据量较大
面向应用,事务驱动
面向分析,分析驱动
面向操作人员,支持日常操作
面向决策人员,支持管理需要
21、联机分析处理(OLAP)的准则:
(1)OLAP模型必须提供多维概念视图;(2)透明性原则;(3)存取能力准则;
(4)稳定的报表能力;(5)客户一服务器体系结构;(6)维的等同性准则;
(7)动态的稀疏矩阵处理准则;(8)多用户支付能力;(9)非受限的跨维操作;
(10)直观的数据操纵;(11)灵活的报表生成;(12)非受限维与聚集层次;
较简洁的五条准则:共享多维信息的快速分析(FASMI):
(1)快速性;(2)可分析性;(3)共享性;(4)多维性;(5)信息性;
22、OLAP基本分析动作
(1) 数据切片:从多维数组选定一个二维子集;
(2) 数据切块:从多维数组选定一个三维子集;
(3) 数据钻取:从较高维度层次下降到较低层次上来观察多维数据;
维度的层次越高,所代表的数据综合度越高,细节越少,数据量越少;维度的层次越低,所 代表的数据综合度越低,细节越充分,数据量越大;
(4) 数据聚合:数据钻取的逆向操作,是对数据进行高层次综合的操作;
(5) 数据旋转:通过旋转可以得到不同视角的数据;
23、 多维数据组织
基于多维数据库的MOLAP (多维联机分析处理)是以多维数据库(MDDB)为核心的,即, 多维数据库就是以多维方式来组织和存储数据;
24、 关系数据组织
为了能够使用关系表在多维数据库中所含的多维信息,ROLAP (关系联机分析处理)将多 维结构进行分解,利用两种表来表达多维信息;
事实表:事实表是用于记录度量信息的关系表;
用来存储变量值和各维的码值(主键)
星型结构:由事实表和维度表组成。最常见、最流行
(1) 事实表(fact table)

数据仓库复习 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数12
  • 收藏数0 收藏
  • 顶次数0
  • 上传人maritime_4
  • 文件大小38 KB
  • 时间2022-06-22