第七章序列模式挖掘
2001-8-15
1
内容概要
基本概念
类Apriori生成候选算法
2001-8-15
2
一、基本概念
序列模式概念最早由Agrawal和Srikant 提出
序列模式与关联模式相仿,但它把数据之间的关联性与时间联系起来。
例如: 如“在购买彩电的人们中,60%的人会在3个月内购买影碟机”
2001-8-15
3
例子1:在两年前购买了Ford 牌轿车的顾客,很有可能在今年采取贴旧换新的购车行动
例子2:在购买了自行车和购物篮的所有客户中,有70%的客户会在两个月后购买打气筒
基本概念
2001-8-15
4
事务发生的时间
客户id
购买项
2
5
2
2
4
3
1
1
4
4
10, 20
90
30
40,60,70
30
30,50,70
30
90
40,70
90
返回
2001-8-15
5
序列< a1a2…an>属于序列<b1b2…b m>
如果存在整数 i1<i2<..<in 并且有
记作< a1a2…an> ∠<b1b2…b m>
基本概念
例如
<(3)(4,5)(8)>∠<(7)(3,8)(9)(4,5,6)(8)>
2001-8-15
8
思考: <(3,5)>是否属于<(3)(5)>??
注意:<(3,5)>并不属于<(3)(5)>,反之亦然
因为后者代表项目3及5,是购买一个之后购买另外一个,而前者是代表两个一起购买
基本概念
2001-8-15
9
序列在序列数据库S中的支持数为序列数据库S中包含序列的序列个数,记为Support()
给定支持度阈值,如果序列在序列数据库中的次数不低于,则称序列为序列模式
长度为l的序列模式记为l-模式
基本概念
2001-8-15
10
序列模式挖掘ppt课件 来自淘豆网www.taodocs.com转载请标明出处.