下载此文档

京东热销手机评论中的 数据分析及简单挖掘.doc


文档分类:IT计算机 | 页数:约27页 举报非法文档有奖
1/27
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/27 下载此文档
文档列表 文档介绍
毕业设计(论文) 题目京东热销手机评论中的数据分析及简单挖掘学生姓名: 指导教师: 理学院数学与应用数学专业 101 班京东热销手机评论中的数据分析及简单挖掘 Analysis of data and simple mining Jingdong selling mobile phone ments 学生姓名: 所在专业: 数学与应用数学班级: 101 指导教师: 申请学位: 理学学士论文提交日期: 2013 -05-20 论文答辩日期: 2013 -06-16 学位授予单位: 摘要手机已然成为人们生活中的必需品,正因为存在着广阔的市场需求,手机的种类也越来越多。如何在这繁多的手机中选择出一部适合于自己的,自然成为即将购买手机用户的一个绕不过去的话题。由此,本文将对所采集的京东的 14部热销手机的评论进行数据分析和数据的简单挖掘。考虑到对手机评价的直观印象是依赖于 star 字段,所以本文先取出每部手机所有的 star 字段。由于事先并不知道 star 的分布情况,先求出基本统计量,如均值、峰度、偏度等,接下来对其进行探索性分析,通过 Kolmogorov-Smirnov 检验计算出数据不呈正态分布,然后通过 Kruskal-Wallis 检验得出手机间存在显著性差异,可是这并不知道每两部手机间的具体情况,所以又对数据进行 Nemeny i 检验,即多独立样本间均值的两两比较检验,从而得出每两部手机间的具体差异情况。最后,通过计算每个分值在所有得分中的占比来衡量手机间的得分情况, 得出 id编号为 982040 的手机得分情况最好,858025 和1005766 两部手机得分情况最差。并且,所得结果与前文所作检验得到的结果也相一致。接下来我们考察每部手机从开始到 2014 年4月24日为止的每天的销售情况。我们发现,在 2013 年6月18日之前就开始销售的五部手机,在 6月18日这一天销售量都有所增长,经查阅新闻可知,这是三星和华为那几日的相关活动或新闻所导致。另外,在 2013 年11月11日,销量相对于平常也有所提升。这是因为在“双十一”那天,各电商企业进行大规模打折促销活动,在一定程度上刺激了手机的销售。最后,通过考察每部手机销售情况的序列图,我们发现国外品牌的手机及两部国产手机销售初期的状况并不好,而另外四部国产手机一开始就取得了良好的销售战绩。主要原因有两点:一、国外手机在国内的一次发行量远不及国产手机在国内的发行量多;二、手机正式销售前是否召开发布会,对手机的销售也有很大影响,召开发布会,扩大知名度,从而刺激销售量的提升。关键词: 热销手机评论、 Excel 、 R、 Nemenyi 检验、序列图 ABSTRACT Mobile phone has e necessary in people ’s life, and because there isa broad market demand, the types of mobile e out in varieties .How to select a suitable one from all kinds of phones has natur ally e an imperative topic for those who want tobuy phones . As a result, this paper will be collected for the analysis and simple mining of14 types ofhot phone s inJ ingdong. Considering that the intuitive impression of mobile evaluation is dependent on the star field, this article first take sout all star field of each phone. Because the distribution of star isn’tknow n in advance, people should find out the basic statistics first , such as mean, kurtosis, and skewness, and then carr yon the exploratory analysis . P eople need calculate ab normally distributed data by Kolmogorov-Smirnov testing, then test the apparent difference among phones through nonparamet

京东热销手机评论中的 数据分析及简单挖掘 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数27
  • 收藏数0 收藏
  • 顶次数0
  • 上传人119060444
  • 文件大小0 KB
  • 时间2016-05-13