市场购物篮分析经济管理学院企业管理专业杨欢欢实验背景随着社会进入信息化时代,现代化的企业搜集了大量数据或高维数据,包括市场、客户、供货商、竞争对手以及未来趋势等重要信息,但是信息超载与无结构化,使得企业决策部门无法有效利用现存的信息,甚至使决策行为产生混乱与误用。通过数据挖掘技术,可以从大量的数据中,挖掘出不同的信息与知识来支持决策,必能产生企业的竞争优势。数据挖掘和知识发现是一个涉及多学科的研究领域。数据库技术、人工智能、机器学****统计学、粗糙集、模糊集、神经网络、模式识别、知识库系统、高性能计算、数据可视化等均与数据挖掘相关。近年来,与数据库的知识发现研究领域已经成为热点,其中关联规则数据挖掘算法是数据挖掘中的一个很重要的课题,它是从背后发现数据中的关联或联系。本实验主要处理描述超级市场购物篮内容(所购买的全部商品的集合)的虚构数据,以及购买者的相关个人数据。目的是寻找购买相似产品并且购买相似产品的客户群特征。实验目的掌握数据挖掘的基础知识,,。,从中发现客户购买的商品之间的关联关系,并进一步归纳出购买相似商品的顾客群的特征。理解并操作实验中数据挖掘的两个部分,一是关联规则建模和一个显示所购买商品关联关系的网络图;,显示购买建立的产品组合的顾客群具有的特征。操作环境1、系统环境:WindowsXP2、软件环境:、软件简介:作为一个数据挖掘平台,Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。强大的数据挖掘功能和显著的投资回报率使得Clementine在业界久负盛誉。同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比,Clementine其功能强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终,在缩短投资回报周期的同时极大提高了投资回报率。四、,名为BSAKETS1n,该数据包含18个字段,1000条记录。1、购物篮摘要:cardid(购买此篮商品的客户的忠诚卡标识符)、Value(购物篮的总购买价格)、pmethod(购物篮的支付方法);2、卡持有者的个人详细信息:Sex、homeown(卡持有者是否拥有住房)、收入、age;3、购物篮内容—产品类别的出现标志:fruitveg,freshmeat,dairy,cannedveg,cannedmeat,frozenmeal,beer,wine,softdrink,fish,confectionery。五、实验步骤1、新建工作流,、该模型的数据存储为BSAKETS1n,首先在选择面板选择可变文件节点作为数据读入节点,双击该结点进行编辑,加入数据存储文件。结果如图1。图12、使用一般规则归纳(GRI)大致了解购物篮内容的关系(关联)、选择要在此建模过程中使用的字段,方法是:编辑“类型”节点,将所有产品类别的方向设置为双向,其他方向设置为无,如图2。其中,双向表示该字段可以是结果模型的输入或输出
数据挖掘实验报告 来自淘豆网www.taodocs.com转载请标明出处.