下载此文档

商务智能教学课件:02 Data Warehouse 1.ppt


文档分类:IT计算机 | 页数:约46页 举报非法文档有奖
1/46
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/46 下载此文档
文档列表 文档介绍
数据仓库 Data Warehouse
数据仓库
从数据库到数据仓库
数据仓库及其四大特征
数据仓库的基本结构
数据集市与数据仓库
数据仓库的应用
*
事务处理应用中的数据库技术
数据库技术的进步
关系数据模型的出现极操作频率高,并发程度大
允许多个用户按分时方式使用资源
分析处理
每次分析可能需要连续运行很长的时间,存取数据量大,但很少做这样的分析处理,也没有并发执行的要求
占用大量的资源
*
(1/3)
分析处理
全面而正确的数据是有效的分析和决策的首要前提
DSS需要集成的数据,包括整个企业内部各部门的相关数据,以及企业外部、竞争对手等处的相关数据
因此,用于分析处理的数据可能来自多种不同的数据源:
同构/异构数据库
文件系统
Internet
外部的用户数据
*
(2/3)
事务处理一般只需要与本部门业务有关的当前细节数据,而对整个企业范围内的集成应用考虑很少,这就造成大部分企业内部的数据是分散而非集成的
事务处理应用的分散性
“蜘蛛网”问题
数据不一致问题
数据类型、单位的不一致性
同名异义、同义异名现象
因数据的重复抽取而带来的数据不一致性
缺少分析所需要的外部、非结构化数据
*
(3/3)
对于需要集成数据的DSS应用来说,在应用程序中对事务处理环境中的这些纷繁复杂的数据进行集成将带来下述问题:
大大加重程序员的负担
重复计算
极低的分析处理效率
*
3. 数据的动态集成问题
静态集成
对所需数据进行一次集成,以后就不再发生变化
动态集成
对集成后的数据进行周期性刷新
在采用静态集成策略时,如果数据源中的数据发生了变化,那么这些变化就不能反映给决策者,导致决策使用的是过时的数据。因此集成数据必须以一定的周期进行刷新(即采用动态集成策略),但传统的事务处理环境并不具备动态集成的能力
*
4. 历史数据问题(1/2)
事务处理
一般只需要当前数据,在数据库中一般也只存储短期数据 (3-6个月),且不同数据的保存期限也不一样
数据库中的过时数据(即历史数据)虽然也能通过数据转储等方式保存下来,但往往被束之高阁,未能得到充分利用
分析处理
更看重历史数据 (5-10年),可以通过对大量历史数据的详细分析来把握企业的发展趋势
历史数据对于事务处理作用不大,但对于决策分析而言,如果没有历史数据的支撑,就变成了“无源之水”、“无本之木”
*
4. 历史数据问题(2/2)
*
5. 数据的综合问题
事务处理需要的是当前的细节性操作数据,而分析处理需要的往往是大量的总结性分析型数据
事务处理系统中积累的是大量的细节数据,而分析处理并不对这些细节数据进行分析,其原因是:
细节数据量太大,影响处理效率
不利于分析人员将注意力集中于有用的信息上
这就是常说的数据库中“数据丰富、信息贫困”现象
因此,在分析前往往需要对细节数据进行不同程度的综合,传统的事务处理系统不具备这种综合能力,而且在数据库系统中,这种综合还往往因为是一种数据冗余而被限制
*
6. 数据的访问问题
事务处理
需要提供多种不同类型的数据访问操作
对于需要修改的数据必须实时“更新”数据库
分析处理
数据的访问操作以“读”操作为主
不需要实时的“更新”操作,但需要定时“刷新”
*
综上所述…
在事务处理环境中直接构建分析处理应用是不合适的,要提高分析处理和决策支持的效率和有效性,必须
将分析型处理及其所需的综合性分析数据从传统的事务型处理和细节性操作数据中分离出来
按照分析型处理的需要重新进行组织,建立单独的分析处理环境
数据仓库正是为建立这种新的分析处理环境而出现的一种数据存储和组织技术
*
数据仓库出现的原因
将数据仓库与操作型数据库分离开来,从而:
提高两个系统的性能
提高操作型数据库的事务吞吐量
两个系统中数据的结构、内容和用法的不同
建立数据仓库的目的并不是要代替传统的事务处理系统/数据库,而是为了适应因市场商业经营行为的改变和市场竞争程度的加剧而进行的分析型处理的需要
数据仓库技术正成为企业信息集成和辅助决策应用的关键技术之一
*
数据仓库
从数据库到数据仓库
数据仓库及其四大特征
数据仓库的基本结构
数据集市与数据仓库
数据仓库的应用
*
数据仓库
在《建立数据仓库》一书中,对数据仓库的定义为:
数据仓库就是一个面向主题的、集成的、非易失的(稳定的)、时变的(随时间不断变化的)数据集合,用于支持经营管理过程中的决策制定
(Informix公司负责研究与开发的副总裁)
数据仓库将分布在企业网络中不同信息岛上的商业数据集成到一起,存贮在一个单一的集成关系型数据库中。利用这种集成信息,可

商务智能教学课件:02 Data Warehouse 1 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数46
  • 收藏数0 收藏
  • 顶次数0
  • 上传人窝窝爱蛋蛋
  • 文件大小643 KB
  • 时间2022-05-16