下载此文档

数据挖掘实验关联规则.docx


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
关联规则挖掘
Association Rule Mining
实现思路
某财务公司生产了一种新产品,本题提供了 600个客户的记录,对这些客户的不同属性进行数据挖掘。 根据题目要求,首先应该对数据进行全面分析。有些属性可以忽略不计,因ome numeric
married {NO, YES} children numeric car {NO, YES} save_act {NO, YES} current_act {NO, YES} mortgage (NO, YES} pep {YES, NO}
从数据中可以看到,children只有4个取值,即0, 1, 2, 3,在bank-data, arff文件中直接将©attribute children numeric 修改为^attribute children (0, 1, 2, 3)
对于age和income的离散,
Filter一>choose^weak^fliters^unsupervised^attribute^Discretize 出现如下
双击Discretize - B 10 - M -1. 0 - R first-last,出现离散参数修改窗口,进行参数修改
因为只需要对age和income,即1, 4项进行修改,故将attribute的first-last修改为1, 4,然后将 离散的分段数改为3段,即将bins的10改为3,改完后如下所示:
然后点击0K,回到主界面后点击Apply,这样就把age和income的数据离散化。
为了显示比较清楚
^©attribute age
{' \' (-inf-34. 333333] (34. 333333-50. 666667] (50. 666667-inf) \''}
改为©attribute age (0 34, 35 50, 51_100} ^©attribute income
{' \, (-inf-24386. 173333]、'',' (24386. 173333-43758. 136667] V ',' (43758. 136667-inf) V '}
改为©attribute income {0_24386, 24386_43758, 43758_600000}
并且对整个文档上述关键字进行修改。
这样就把age, income关键字的数据都分成了三段。
childer离散后:
age昌散后:
income离散后:
6,用aprior算法进行数据挖掘
1)用置信度(confidence)作为度量,最小支持度和最大支持度分别设置为0. 1和1,置信度设置为
0. 8,并对产生的结果取PEP最为结论的关联规则整理如下:
1
married=YE children=O save_act=YES current_act=YES
==>
pep=NO
conf:()
2
married=YES children=O save_act=YES mortgage=NO
==>
pep=NO
conf:()
3
married=YES children=O current_act=YES mortgage=NO
=

数据挖掘实验关联规则 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人蓝天
  • 文件大小264 KB
  • 时间2022-07-02