下载此文档

决策支持系统的核心数据挖.ppt


文档分类:金融/股票/期货 | 页数:约79页 举报非法文档有奖
1/79
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/79 下载此文档
文档列表 文档介绍
决策支持系统的核心数据挖
第1页,本讲稿共79页
0 决策支持系统(DSS)
数据
模型
推理
知识
决策
人机交互
第2页,本讲稿共79页
1 数据挖掘的基本概念
数据挖掘(DM)的产生背景
随着数据制定,如分类设计、交叉购物和促销分析等。
第18页,本讲稿共79页
2 数据挖掘功能——关联规则
购物篮分析
购物篮分析是关联规则挖掘的最初形式
假定作为某商店经理,你想更加了解你的顾客的购物****惯。例如:“什么商品组或集合顾客多半会在一次购物时同时购买?”。为解答这个问题,可以在商店顾客事务零售数据上运行购物篮分析。
分析的结果可用于市场规划、广告策划和分类设计。
第19页,本讲稿共79页
2 数据挖掘功能——关联规则
购物篮分析
若设商店中所有销售商品为一个集合,则每个商品均为一个布尔变量,表示该商品是否被(一个)顾客购买。因此每个购物篮就可以用一个布尔向量表示。
第20页,本讲稿共79页
2 数据挖掘功能——关联规则
购物篮分析
分析相应布尔向量,得到反映商品频繁关联或同时购买的购买模式,并可用关联规则的形式表示模式。例如,购买计算机也趋向于同时购买财务管理软件可用以下关联规则表示:
第21页,本讲稿共79页
2 数据挖掘功能——关联规则
购物篮分析
关联规则的支持度(support)2% 表示分析中的全部事务的2% 同时购买计算机和财务管理软件。
关联规则的置信度(confidence)60%表示:购买计算机的顾客60% 也购买财务管理软件。
第22页,本讲稿共79页
2 数据挖掘功能——关联规则
Apriori算法
Apriori算法是根据有关频繁项集性质的先验知识而命名。该算法使用一种逐层搜索的迭代方法,利用k-项集探索(k+1)-项集。
具体做法:首先找出频繁1-项集的集合,记为L1 ;再用L1找频繁2-项集的集合L2;再用L2找L3 …如此下去,直到不能找到频繁k-项集为止。找每个Lk需要一次数据库扫描。
第23页,本讲稿共79页
2 数据挖掘功能——关联规则
Apriori算法
Apriori算法的有效性,在于它利用了一个非常重要的原理,即Apriori性质:如果一个项集是频繁的,则这个项集的任意一个非空子集都是频繁的。
Apriori性质基于如下观察:如果项集I不满足最小支持度阈值min_sup,则I 不是频繁的。如果增加项A到I,则结果项集不可能比I更频繁出现。因此,也不是频繁的。
第24页,本讲稿共79页
2 数据挖掘功能——关联规则
Apriori算法
该性质属于一种特殊的分类,也称作反单调性。意指如果一个集合不能通过测试,则它的所有超集也都不能通过相同的测试。
反单调性能迅速减值,提高搜索频繁项集的处理效率。
第25页,本讲稿共79页
2 数据挖掘功能——关联规则
Apriori算法
整个过程由连接和剪枝两步组成,即
连接步:为找Lk,可通过Lk-1与自己连接,产生一个候选k-项集的集合,该候选项集的集合记作Ck 。
剪枝步确定频繁项集
连接步产生候选项集
第26页,本讲稿共79页
2 数据挖掘功能——关联规则
Apriori算法
设l1和l2是Lk-1中的项集,记号li [j]表示li的第j项。为方便计,假定事务或项集中的项按字典次序排序。
执行连接 , 其中Lk-1的元素是可连接的,如果它们前(k-2)个项相同。
Lk-1
Lk-1
第27页,本讲稿共79页
2 数据挖掘功能——关联规则
Apriori算法
即Lk-1的元素l1和l2是可连接的,如果( l1[1] = l2[1] ∧ l1[2] = l2[2] ∧ … ∧ l1[k-2] = l2[k-2] ∧ l1[k-1] < l2[k-1] )。条件(l1[k-1] < l2 [k-1])可确保不产生重复的项集。
第28页,本讲稿共79页
2 数据挖掘功能——关联规则
Apriori算法
剪枝步
Ck是Lk的超集,即它的成员不一定都是频繁项集,但所有的频繁k-项集都包含在Ck中
扫描数据库,确定Ck中每个候选项集的计数,从而确定Lk 。然而, Ck可能很大,这样所涉及的计算量就很大。
第29页,本讲稿共79页
2 数据挖掘功能——关联规则
Apriori算法
剪枝步
为了压缩 Ck ,可利用Apriori性质:任何非频繁的(k-1)-项集都不可能是频繁k-项集的子集。因此,若一个候选k-项集的(k-1)-项子集不在 Lk-1中,则该候选也不可能是频繁的,从而可以从 Ck 中删除。
第30页,本讲稿共79页
2 数据挖掘功能——关联规则
【例】一个Ap

决策支持系统的核心数据挖 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数79
  • 收藏数0 收藏
  • 顶次数0
  • 上传人文库新人
  • 文件大小2.91 MB
  • 时间2022-01-27