下载此文档

数据仓库与数据挖掘 课件.ppt


文档分类:IT计算机 | 页数:约24页 举报非法文档有奖
1/24
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/24 下载此文档
文档列表 文档介绍
该【数据仓库与数据挖掘 课件 】是由【yzhlya】上传分享,文档一共【24】页,该文档可以免费在线阅读,需要了解更多关于【数据仓库与数据挖掘 课件 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。数据仓库
----SQLserver2000AnalysisServices
数据库与数据仓库
数据库-数据管理-事务处理-获取数据-OLTP-银行的存款和取款
数据仓库-管理技术-决策支持-分析数据-OLAP-规律趋势决策预测
数据仓库(DataWarehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策制定过程。
数据仓库不是产品。
数据库技术-存储数据和管理资源
统计分析技术-分析和提取信息
人工智能技术-挖掘知识和发现规律
利用数据仓库解决四种类型的问题:
?
?(科室应作何相应调整?)
-10月份经消化内科某医师诊治的十二指肠球部溃疡患者的平均住院天数及药品费用构成比是多少?
?其中哪个是最关键因素?
数据仓库设计与开发的一般过程:













☆数据仓库的数据模型结构

星型模型由一个事实表和维表组成,事实表是星型模型的核心表,包含两种类型的列,第一种列是维度表的索引列,这些列中存储了各维表的主键值,它们组合成事实表的主键;而其他非主属性的列则称为事实列,其中包含了用于计算的信息,即多维数据集中的度量值。事实表中的每个事实指向每个维表中的一个元组。

雪花模型是对星型模型的一个扩展,每个维表都可以向外连接多个维表。雪花模型是对星型模型的维表进一步标准化,维表分解成与事实表直接关联的主维表和与主维表关联的次维表。它的优点是通过最大限度的减少存储量以及将较小的标准化表而不是较大的非标准化表联合在一起来改善查询性能。由于采用标准化及维的较低粒度,雪花模型增加了应用程序的灵活性,但由于雪花模型增加了连接操作的次数,因而也增加了查询的复杂性。
级别、粒度、成员属性
粒度是数据仓库中数据单元的详细程度和级别。粒度越小,级别越低,细节程度越高;反之,数据综合程度越高,粒度越大,级别就越高。数据的粒度越高,所需要存储的数据量越少,但对决策者的重要性却随之增加。
成员属性一般为某一级别的具体属性,通过为某一级别创建成员属性,可以进行数据挖掘。
时间、病种、患者、……;区域、产品、……
时间维度:年、月、日
病种维度:ICD主类、ICD次类、ICD子类、疾病名称
患者维度:所属科室、经诊医师、患者(成员属性:性别、年龄、身份、费用类别、手术情况、入院方式、入院病情、出院方式、治疗结果、就诊次数、所患疾病等)
治疗结果:只有一个级别
度量值:主要是数值型字段,如:费用金额、住院天数等
衍生度量值:就诊人次数等
计算成员:均值、百分比、率等
时间代码
科室代码
病种代码
性别代码
年龄代码
身份代码
转归代码
住院天数
术前住院天数
住院总费用
药品费用
……
性别维表
年龄维表
身份维表
时间维表
科室维表
病种维表
转归维表
住院事实表
星型模型
SQLserver2000数据挖掘
2005年11月10日

数据仓库与数据挖掘 课件 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数24
  • 收藏数0 收藏
  • 顶次数0
  • 上传人yzhlya
  • 文件大小1.37 MB
  • 时间2022-12-02