下载此文档

数据挖掘课程论文--关联分析.docx


文档分类:IT计算机 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
学生超市购买商品的关联性分析
前言
“啤酒与尿布”是超市商品布局的一个经典案例,它是说在美国的沃尔玛超市中,将啤酒和尿布这两个看起来毫不相关的物品摆放在相邻的位置。其原因就是沃尔玛通过大量的数据分析,发现有非常多的年轻爸爸在购买尿布的时候会顺手购买一些啤酒,因此沃尔玛将这两样完全没有联系的商品放在了一起。这是关联分析在商业中一个非常成功的案例。
关联分析在超市中的应用,不仅仅局限在上述的沃尔玛的对超市商品布局的改善,特别针对于我校学生超市的特点,应用关联分析能够了解学生的购物特点及****惯,从而改善超市环境,提高收益。
我校学生超市的特点:
规模较小。通常情况下,位于学校的超市其规模通常较小,由于这个特点,使得学生超市的布局改善的空间非常小。
商品相对较为单一。作为学生超市,其服务对象基本都是学生,针对学生的特点,学生超市的商品通常以日用品为主,主要包括衣食住行中的食和住,此外有比较多的学****用品。
我校学生在学生超市消费的特点:
购物以食物、生活用品和学****用品为主。
购物时间比较集中。围绕着上课,学生在学生超市购物的时间主要集中在上午上课前、中午放学后、下午放学后以及晚自****后。
在超市停留时间较短。通常情况下,我校学生在超市购物停留时间较短,更多的都是有目的性的购物。
正因为以上学生超市和学生购物的特点,我们在做关联分析的时候将商品主要集中在了食物、日用品和学****用品上。数据来源于我校学生实验超市,采集了2012年9月21日——9月30日的数据。
数据整理
我们所得到的数据主要存在的问题包括重复记录、存在退货等,因此主要使用EXCEL对存在重复记录和退货的情况处理。删除重复记录,使得每一项小票(代表一个ID)说购买的某种商品的记录都是1次,从而避免数据重复对分析结果的干扰。而对于退货的商品,这去除该项记录。经过这两项的整理,最后共得到有效的商品消费记录为45006项。
关联分析
数据分析主要使用的是SAS中的Enterprise Mining模块。关联规则分析的
模块如下图,过程主要包括变量分析、数据转换、关联分析、报告和解释等方面。
在关联分析的设置中,将支持度设置为20%,置信度设置为80%,同时最多只考虑四个商品之间的关联性,共得到记录2047项。结果如下表1:(根据支持度排序的结果,%),共得到52个记录,表一只列出了前20项。
表一
Relations
Lift
Support(%)
Confidence(%)
Transaction Count
Rule
1
2



102
21 ==> 1
2
2



102
1 ==> 21
3
2



91
6923644223458 ==> 5
4
2



91
5 ==> 6923644223458
5
2



81
4 ==> 5
6
2



81
5 ==> 4
7
2



67
6907992101064 ==> 5
8
2

数据挖掘课程论文--关联分析 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人静雨蓝梦
  • 文件大小0 KB
  • 时间2015-05-09