下载此文档

关联规则分析及应用.ppt


文档分类:IT计算机 | 页数:约24页 举报非法文档有奖
1/24
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/24 下载此文档
文档列表 文档介绍
Data Mining 关联规则分析及应用 2012-10-12 1 目录目录基本概念关联规则挖掘过程分类关联规则的价值衡量 4 123挖掘算法关联规则的应用 56 2012-10-12 2 绪论绪论?在购买铁锤的顾客当中,有 70%的人同时购买了铁钉。?年龄在 40 岁以上,工作在 A区的投保人当中,有 45%的人曾经向保险公司索赔过。?在超市购买面包的人有 70% 会购买牛奶 2012-10-12 3 绪论绪论 2012-10-12 4 一、基本概念一、基本概念设I= {I 1,I 2, …,I n} 是项的集合。?任务相关数据 D: 是事务(或元组)的集合。?事务 T: 是项的集合,且每个事务具有事务标识符 TID 。?项集 A: 是T 的一个子集,加上 TID 即事务。?项集(Items) : 项的集合,包含 k个项的项集称为 k-项集, 如二项集{I 1,I 2}。?支持度计数(Support count) :一个项集的出现次数就是整个数据集中包含该项集的事务数。 2012-10-12 5 一、基本概念一、基本概念 TID Items 001 I 1、I 2、I 5 002 I 2、I 4 003 I 2、I 3 004 I 1、I 2、I 4 005 I 1、I 3 006 I 2、I 3 007 I 1、I 3 008 I 1、I 2、I 3、I 5 009 I 1、I 2、I 3D T AB I n( n=1,2, …) 指具体项目,如购物篮分析中: I 1=苹果 I 2=面包 I 3=牛奶 I 4=尿布 I 5=啤酒 Support-count( I 1 )=6 2012-10-12 6 一、基本概念一、基本概念?关联规则:形如 A => B 的蕴涵式,其中 A ?I, B?I,并且 A∩B =ф。?支持度:关联规则在 D中的支持度(support) 是D中事务同时包含 A、B的百分比,即概率。[规则代表性、重要性衡量] Support(A B)= P ?? A ∩ B ????????????? support _ count(A ∩ B) count ? T) ?频繁项集: 若一个项集的支持度大于等于某个阈值。 2012-10-12 7 一、基本概念一、基本概念?置信度 c:是包含 A的事务中同时又包含 B的百分比, 即条件概率。[规则准确性衡量] c onfidence ?? A ?? B ???? P ?? B | A??强关联规则:同时满足用户定义的最小支持度阈值(min_sup )和最小置信度阈值(min_conf) 的规则称为强规则。 2012-10-12 8? 9 support _ count ?? A U B ? support_count ?? A?二、关联规则挖掘过程二、关联规则挖掘过程两个步骤: ?找出所有频繁项集。?由频繁项集生成满足最小信任度阈值的规则。挖掘模式: 2012-10-12 9min_sup min_conf 产生频繁项集生成强关联规则规则评价用户 Database 二、关联规则挖掘过程二、关联规则挖掘过程关联规则挖掘举例: 假定数据包含频繁项集 M={ I 1,I 2,I 5}。可以由 M 产生哪些关联规则? 2012-10-12 10

关联规则分析及应用 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数24
  • 收藏数0 收藏
  • 顶次数0
  • 上传人12344
  • 文件大小4.25 MB
  • 时间2017-05-26