下载此文档

基于R语言的轿车销量分析基于R语言的轿车销量分析.doc


文档分类:汽车/机械/制造 | 页数:约2页 举报非法文档有奖
1/2
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/2 下载此文档
文档列表 文档介绍
基于R语言的轿车销量分析基于R语言的轿车销量分析.doc基于R语言的轿车销量分析基于R语言的轿车销量分析
摘要:该文主要对轿车销量的进行初步分析,数据来自数据堂网站,主要使用R语言为工具,进行数据分析,通过导入sqldf数据包,对原始数据进行筛选,排序;以及使用高级绘图函数对轿车销量进行图表分析。
中国 8/vie
关键词:R语言;数据分析;轿车销量
中图分类号:TP311 文献标识码:A :1009-3044(2017)04-0070-02
R语言是一个有着统计分析功能以及强大作图功能的语言环境,主要是统计学家为解决数据分析领域问题而开发的语言。
R语言具有功能强大的程序包,在数据计算,统计分析以及数据挖掘等方面都所向披靡,本文基于R对轿车销量数据进行分析。
1 数据情况
数据是一件麻烦事,在工作中,有多达60%的数据分析时间都花在了实际分析前数据的准备上。
现有2011年4月至2013年10月全国轿车车型销量排名数据:
数据共有6000多条,按照年份,月份,各厂商品牌统计轿车的销量,数据比较杂乱;所以首先要制定分析目标与方案。
2数据处理
首先我们将excel数据导入到R中,将excel文件以剪贴板的格式进行保存。:
我们首先制定数据分析的目标:
数据的特点是分月份,年份,品牌的,我们首先分析2013年度畅销车型。
那么我们需要对2013年各品牌进行汇总然后排序,对于求和以及排序,使用SQL语句来进行比较方便,那么在R中如何使用SQL语句呢?
R语言具有sqldf包,,所以在R中安装和加载sqldf包。需要按照年度累计进行降序排序,只保留车型和本年累计两列。

结果如下:
从排序结果可以看出,2013年,年度畅销车型为大众朗逸,别克凯越和大众速腾。
3 图表分析
上面,我们结合数据分析的目标,对原始数据进行了整理,在R中应用sqldf对数据进行了筛选和排序,得到畅销车型的分析结果。
字不如表,表不如图。由于R具有强大的绘图功能,提供了多种绘图函数,有高水平绘图函数,低水平绘图函数以及交互式绘图函数。
直方图又称为柱状图,用来估计数据的概率分布;下面我们应用高水平函数中的直方图函数来看一下汽车年度销量的分布情况。使用hist函数。
从图中可以看出,年度销量在300000~350000辆之间

基于R语言的轿车销量分析基于R语言的轿车销量分析 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数2
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小博士
  • 文件大小49 KB
  • 时间2017-08-21