matlab实现apriori算法源代码一、实验目的
通过实验,加深数据挖掘中一个重要方法一一关联分析的认识,其经典算法为apriori算法,了解影响apriori算法性能的因素,掌握基于apriori算法理论的关联分析的原理和方法。
个最大2-itemsets中,第一个项目相同,在L2中满足该条件的有{I2,I3},{I2,I5}.这两个集合经过join步后,产生集合{I2,I3,I5}.在prune步中,测试{I2,I3,I5}的子集{I3,I5},{I2,I3},{I2,I5}是否在L2中,由L2可以知道{I3,I5},{I2,I3},{I2,I5}本身就是最大2-itemsets.
即{I2,I3,I5}{I2,I3,I5}为侯选3-,生成最大的3-tiemsetsL3。此时,从L3中不能再生成侯选4-itemset。
Apriori算法结束.
算法的图例说明
APR10RI戏法
五、
rm
TI
11J3J4
12
13
^
「4
DiI?.
圭*,,、映卷计*
A
g辑«莎十楼忌好M
顿女:
支持改rV-fft
FU
J
(12)
3
!13]_
3
g】
3
-AM扫瓜**且丈
&5EW咨支特&计昧
碰染
讫却/#计需
()1
实验结果
:
农汁主々加小
硕堡
玄持展订数
;
4
|12,13(
4
()
【
^
此独皿扯Jt打HA
宁积</、支打成计有
V
7777
Itestfert-记事本又怦UJ祸世)唳理)&adbutiercoffeediapermilkeggbreadbutterfishchicken
bxc^dLuttexfisrhdiapermilkbroad!土g口wgi:Qggcoffeesv^atchicken@;ghrrmwddiappTnilk旨匐Ith^ATteaeggcookiediapexmilk实验结果如下:
3innundWindow
'b匚善用if
■beer'
'di
■&如,
TniIF
fit
'iKLlk'
ETiS—席足耍来铤号在所sn茸集球左为9b-E0rp'bEead''nilk*■b朝/'di^psE1,mlk,rb-te-id'iliapec1"tllIV六、实验总结
Apriori算法可以很有效地找出数据集中存在的关联规则且能找出最大项的关联规则,但从以上的算法执行过程可以看到Apriori算法的缺点:
第一,在每一步产生侯选项目集时循环产生的组合过多,没有排除不应该参与组合的元素;第二,每次计算项集的支持度时,都对数据库D中
matlab实现apriori算法源代码 来自淘豆网www.taodocs.com转载请标明出处.