下载此文档

数据挖掘教程:在大型数据库中挖掘关联规则.ppt


文档分类:IT计算机 | 页数:约21页 举报非法文档有奖
1/21
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/21 下载此文档
文档列表 文档介绍
第六章 在大型数据库中 挖掘关联规则
6.6.1 基于约束的挖掘
使用约束的必要性
在数据挖掘中常使用的几种约束:
知识类型约束:指定要挖掘的知识类型
如关联规则
数据约束: 指定与任务相关的数据集
Find product pairs sold together in Vancouver in Dec.’98.
维/层次约束:指定所用的维或概念结构中的层
in relevance to region, price, brand, customer category.
规则约束:指定要挖掘的规则形式(如规则模板)
单价 (price < $10)的交易项目可能引发购买总额 (sum > $200).
兴趣度约束:指定规则兴趣度阈值或统计度量
如 (min_support  3%, min_confidence  60%).
假定AllElectronics的一个销售多维数据库有如下关系:
Sales(customer_name,item_name,transaction_id)
Lives(customer_name,region,city)
Items(item_name,category,price)
Transaction(transaction_id,day,month,year)
(1) mine associations as
(2)lives(C,_,”Pudong”)^sales(C,{I},{S})=>sales(C,{J}{T})
(3) from sales
(4)where S.year=1999 &&T.year=1999
&&I.category=J.category
(5)group by C,I.category
(6)having sum(I.price<=100)&&min(J.price)>=500
(7)with support threshold=1%
(8)with confidence threshold=50%
Lives(C,_,”Pudong”)^Sales(C,”Census_CD”,_)^Sales(C,”MS/Office”,_)=>Sales(C,”MS/SQLSever”,_) [1.5%,65%]
6.6.2 约束的分类
单调性约束(monotone constraint)
反单调性约束(anti-monotone constraint)
可转变的约束(convertibale constraint)
简洁性约束(succinct constraint)
约束的有关概念
项目集:I={i1,i2,……,im},
交易:T=<tid,It>
模式S是项目集的子集,S={ij1,ij2,…,ijk}
模式S包含与T,T=<tid,It>,iff S<=It;
S’是S的子模式(subpattern)且S 是S’的超模式(superpattern),if 有S’<=S.
约束的有关概念(续)
定义约束: C是作用于项目集I的幂集(powerset)上的谓词,C(S)=True/False;
满意模式集(satisfying pattern set)
SATc(I)是指那些完全满足约束C的项目集的全体
将约束条件用于频繁集的查询无非是找出那些满足C的频繁集
单调和反单调的规则约束
规则 Ca 是 反单调的(anti-monotone) iff
对于任给的不满足Ca的项集(模式) S, 不存在S的超集能够满足 Ca
e.g: Ca : min(S)>=v , v是S的一个项集
约束Cm 是单调的iff.对于任给的满足Cm的项集(模式) S, 每一个S的超集都能够满足 Cm
e.g: Cm : min(S)<=v, v是S的一个项集
单调/反单调性约束描述
v  S
S  V
S  V
S  V
min(S)  v
min(S)  v
min(S)  v
max(S)  v
max(S)  v
max(S)  v
count(S)  v
count(S)  v
count(S)  v
sum(S)  v
sum(S)  v
sum(S)  v
avg(S)  v,   { , ,  }
(frequent constraint)
yes
yes
no
partly
yes
no
partly
no
yes
partly
no
yes
partly
no
yes
partly

数据挖掘教程:在大型数据库中挖掘关联规则 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数21
  • 收藏数0 收藏
  • 顶次数0
  • 上传人经管专家
  • 文件大小213 KB
  • 时间2022-05-18