下载此文档

数据挖掘实验报告三.doc


文档分类:IT计算机 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
实验三实验原理K-Means算法是一种clusteranalysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。在数据挖掘中,K-Means算法是一种clusteranalysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。算法原理:(1)随机选取k个中心点;(2)在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类;(3)更新中心点为每类的均值;(4)j<-j+1,重复(2)(3)迭代更新,直至误差小到某个值或者到达一定的迭代步数,(N)时间复杂度o(I*K*N)其中N为样本点个数,K为中心点个数,I为迭代次数实验目的:1、利用R实现数据标准化。2、利用R实现K-Meams聚类过程。3、了解K-Means聚类算法在客户价值分析实例中的应用。实验内容依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。对其进行标准差标准化并保存后,采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。编写R程序,完成客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数实验步骤1、依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。2、确定要探索分析的变量3、利用R实现数据标准化。4、采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。实验结果客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数思考与分析使用不同的预处理对数据进行变化,在使用k-means算法进行聚类,对比聚类的结果。kmenas算法首先选择K个初始质心,其中K是用户指定的参数,即所期望的簇的个数。,首先采用层次凝聚算法决定

数据挖掘实验报告三 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息