2020/2/19史忠植关联规则1内容提要引言Apriori算法FP-growth算法并行关联规则挖掘多维关联规则挖掘相关规则关联规则改进2020/2/19史忠植关联规则2关联规则关联规则反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物就能够通过其他事物预测到。关联规则表示了项之间的关系。示例:cereal,milkfruit“买谷类食品和牛奶的人也会买水果.”?Chips=>SalsaLettuce=>SpinachPersonBasketAChips,Salsa,Cookies,Crackers,Coke,BeerBLettuce,Spinach,Oranges,Celery,Apples,hips,Salsa,FrozenPizza,FrozenCakeDLettuce,Spinach,Milk,Butter2020/2/19史忠植关联规则4基本概念通常,数据包含:TIDBasket事务ID项的子集2020/2/19史忠植关联规则5关联规则挖掘在事务数据库,关系数据库和其它信息库中的项或对象的集合之间,发现频繁模式,关联,相关,:数据库中出现频繁的模式(项集,序列,等等)2020/2/19史忠植关联规则6基本概念项集事务关联规则-事务数据集(例如右图)事务标识TID每一个事务关联着一个标识,-idItemsbought10A,B,C20A,C30A,D40B,E,F2020/2/19史忠植关联规则7关联规则的度量支持度sD中包含A和B的事务数与总的事务数的比值规则AB在数据集D中的支持度为s,其中s表示D中包含AB(即同时包含A和B)B在数据集D中的可信度为c,(B|A)(AB)=P(B|A)条件概率P(B|A)(包含或排除):最小支持度–表示规则中的所有项在事务中出现的频度最小可信度-表示规则中左边的项(集)的出现暗示着右边的项(集)出现的频度2020/2/19史忠植关联规则10市场购物篮分析I是什么?事务IDB的T是什么?s(Chips=>Salsa)是什么?c(Chips=>Salsa)是什么?事务ID购物篮AChips,Salsa,Cookies,Crackers,Coke,BeerBLettuce,Spinach,Oranges,Celery,Apples,hips,Salsa,FrozenPizza,FrozenCakeDLettuce,Spinach,Milk,Butter,Chips
高级人工智能第十二章 来自淘豆网www.taodocs.com转载请标明出处.