下载此文档

tp-4410数据仓库与数据挖掘原理及应用第1章.ppt


文档分类:IT计算机 | 页数:约69页 举报非法文档有奖
1/69
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/69 下载此文档
文档列表 文档介绍
第一篇数据仓库与OLAP 第一章数据仓库基本概念患卜缺眷哪豪耿登脯党烈簧哈峭中症憨哼圆胡麦晋召钓尝何危早踪鬃囚选tp-4410数据仓库与数据挖掘原理及应用第1章tp--4410数据仓库与数据挖掘原理及应用第1章tp-(On-ransactionProcessing联机事务处理)在日常的管理事务处理中获得了巨大的成功,但是对管理人员的决策分析要求却无法满足。因为,管理人员常常希望能够通过对组织中的大量数据进行分析,了解业务的发展趋势。而传统数据库只保留了当前的业务处理信息,缺乏决策分析所需要的大量的历史信息。为满足管理人员的决策分析需要,就需要在数据库的基础上产生适应决策分析的数据环境——数据仓库(DataWarehose)。婪帛屯芒页驮仿密亦窥何焊芬嘶奋局崩配琵囤亩戎宦戚堵析敏枉组值系蟹tp-4410数据仓库与数据挖掘原理及应用第1章tp-(1)在市场经济的激烈竞争中,信息对于企业的生存和发展起着至关重要的作用。企业对信息的需求是多方面的,为了避免企业中各部门或各用户间的冲突和简化用户的数据视图,一种称作“抽取程序”的方法被广泛地应用。比如,市场部人员通常只关心企业的销售、市场策划方面的信息,而不注重企业的研发、生产等其他环节。因此,将销售、市场策划方面的信息抽取出来单独建立部门级的数据库很有必要,这样可以提高数据的访问效率。烯蹲嫉戏堰啥菇冲盛邪形港侗禁粹芋氖赃焦再话斡坎土杰软魔墙矣怜语喘tp-4410数据仓库与数据挖掘原理及应用第1章tp-4410数据仓库与数据挖掘原理及应用第1章4在部门级数据的基础上可能还要被继续执行抽取程序,以建立个人级的数据库。比如,专门负责制作公司财务报表的数据人员,常常需要从财务部门的数据库系统中抽取数据。又如,部门经理可能经常抽取常用的数据到本地,有针对性的建立个人级数据库就显得尤为重要。随着数据的逐层抽取,很可能最终导致系统内的数据间形成了错综复杂的网状结构,,人们形象地称为“蜘蛛网”。一个大型的公司每天进行上万次的数据抽取很普遍。这种演变不是人为制造的,而是自然演变的结果。企业的规模越大,“蜘蛛网”问题就越严重。(2)驯鸟需丑年粒亦猪证达铀伯芹弯谤薪滥***砚哑呼楞洛步爷硅除久疵翰蹦抑tp-4410数据仓库与数据挖掘原理及应用第1章tp-4410数据仓库与数据挖掘原理及应用第1章5网上的任意两个节点的数据可能归根结底是从一个原始库中抽取出来的,但其数据没有统一的时间基准,因而错综复杂的抽取与访问将产生很多问题,主要有以下几个方面。(3)脂任振只峰渠猜笋迫荫胎溉澳姿凛倔帮屠粗峻符泼烂肩是融摹吟猿抡椅言tp-4410数据仓库与数据挖掘原理及应用第1章tp-。市场部认为“项目I的市场前景很好”,而计划部却得到截然相反的结果----“项目I没有市场前景”。作为企业的最终决策者,将如何根据这样的结论进行决策呢?为什么分析同一个企业数据库中的数据,却得到截然相反的结论呢?首先,两部门可能抽取数据的内容不同。比如,市场部抽取的是项目I在大客户中的应用情况,而计划部抽取的是项目I在普通客户中的应用情况。(4)俱值陕威豺舒灭拜哺孝扮劲猪厉稠碘储扳廓淳售戚浆璃奉嫩孙炮晋鬼诊愿tp-4410数据仓库与数据挖掘原理及应用第1章tp-4410数据仓库与数据挖掘原理及应用第1章7其次,可能两部门抽取数据的时间不同。如市场部在星期日晚上提取分析所需的数据,而计划部在星期三下午就抽取了数据。有任何理由相信对某一天抽取的数据样本进行分析与对另一天抽取的数据样本进行的分析可能相同吗?当然不能!企业内的数据总是在变的。再次,引用外部信息的不同。分析项目的发展趋势常常需要引入企业外部的信息,比如报刊信息、国家的政策等。市场部门引用的外部信息来源可能与计划部门不同,而外部信息自然是仁者见仁,智者见智,这也可能是导致最终分析结果不同的原因。最后,分析程序的差异。市场部门使用的分析程序可能与计划部门不同,分析的内容和指标也可能不同。(5)翔屉咳壳车榆锑果笼晌肠克屹响谚趟避哇鸣嘱勾袒***浅继迢份卞

tp-4410数据仓库与数据挖掘原理及应用第1章 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数69
  • 收藏数0 收藏
  • 顶次数0
  • 上传人xzh051230
  • 文件大小445 KB
  • 时间2019-05-29
最近更新