下载此文档

数据仓库与数据挖掘复习.doc


文档分类:IT计算机 | 页数:约2页 举报非法文档有奖
1/2
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/2 下载此文档
文档列表 文档介绍
数据仓库与数据挖掘复习.doc复****资料名词解释数据仓J车:数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。螺旋式周期性开发方法:针对未来航空电了系统而临的挑战和航空电了系统设计的特点,:在数据仓库中,无数据是描述数据仓库数据的结构和建立方法的数据。4数据才努掘:是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学****专家系统和模式识别等方法来实现目标。:一种更小、更集中的数据仓库。原始数据从数据仓库流入不同的部门以支持这些部门的定制化使用。这些部门级的数据库就称为数据集市。迎合了专业用户群体的特殊需求。二、 简答题为什么不能依靠传统的业务处理系统进行决策分析?传统业务系统数据量少,不能用来做出正确的预测,是针对口常事务处理而设计的,因此不能支持短时间内大量数据的分析和计算;传统业务系统数据杂乱,可能存在大量的坏数据以及异常数据,会影响决策分析的正确性。如果在传统业务系统中进行决策分析,那么必然会影响到系统的使用数据粒度,数据粒度划分策略数据仓库中数据的细化和综合程度。划分为:详细数据、轻度总结、高度总结三级。原则:细化程度越高,粒度越小;细化程度越低,粒度越大。、数据存储和管理、,、规则型挖掘技术、神经网络型挖掘技术、遗传算法型挖掘技术、粗糙型挖掘技术、决策树型挖掘技术、三、简述美联规则挖掘算法Apriori的算法思想并说明如何利用Apriori性质生成频繁项集。首先遍历目标数据库一次,记录每个项目或属性的出现次数,即计算每个项目的支持度,收集所有支持度不低于用户最小支持度的项目构成频繁1-项集L1,然后链接L1中所有的元素形成候选2项集C2,再次遍历事务数据库,计算C2中每个候选2•项集的支持度,,再链接L2形成C3,遍历数据摩得L3,反复执行以上过程,直到没有候选项集为止。设定最小支持度s和最小置信度c。使用候选项集。首先产生出候选的项的集合,即候选项集,若候选项集的支持度大于或等于最小支持度,则该候选项集为频繁项集。四、简述数据仓库中需要的元数据,这些元数据在不同的阶段应该发挥的作用技术元数据和业务元数据。作用:1、描述哪些数据在数据仓库中;2、定义要进入数据仓库中的数据和从数据仓库中产生的数据;3、记录根据业务事件发生而随之进行的数据抽取工作时间安排;4、记录并检测系统数据一致性的要求和执行情况;5、衡量数据质量。五、通过以下

数据仓库与数据挖掘复习 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数2
  • 收藏数0 收藏
  • 顶次数0
  • 上传人sssmppp
  • 文件大小69 KB
  • 时间2020-06-02