下载此文档

R语言入门总结.pptx


文档分类:IT计算机 | 页数:约37页 举报非法文档有奖
1/37
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/37 下载此文档
文档列表 文档介绍
语言入门 R语言简介?R是开源的分析软件,在数据处理、统计、数据可视化方面具有较强的优势。?R可运行于多种平台之上,包括 Windows 、 UNIX 和 Mac OS X 。?R可以轻松地从各种类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件,乃至数据仓库。它同样可以将数据输出并写入到这些系统中。?在R网站上,有四千多个程序包,提供了包括分析地理数据、处理蛋白质质谱,甚至是心里测验分析的功能。?R是一种区分大小写的解释性语言。 R的获取及安装?R可以在 - 上免费下载。 Linux 、 Mac OS X 和 Windows 都有相应编译好的二进制版本。根据所选平台的安装说明进行安装即可。 R包的安装及载入?R自带了一系列默认包(包括 base 、 datasets 、 graphics 等)其他包可通过下载来进行安装。安装好需载入到会话中才能使用。?包的下载及安装:(仅需一次) (“包的名称”) ?包的载入:(一个会话需载入一次) library( 包的名称) 数据的读取?读取文本文件: (“ d:/data/ ”,header =T) ?读取 Excel 数据: ①安装并载入 RODBC 包②获取 Excel 连接: a<- onnectExcel (2007) (“d :/ data/( xlsx )”) ③d ata<- sqlFetch (a,” Sheet2 ”) ④关闭 ODBC 连接,释放空间: close(a) 数据的读取?读取 SPSS 数据: ①安装并载入 foreign 包②d ata<- (“ d:/ data/salary. sav ”, =T) —数据读入后为数据框变量③ dim(data) ?读取数据库文件: ①安装并载入 RODBC 包②建立连接访问数据库: channel<- onnect (“数据库名”, uid =“用户名”, pwd =“密码”) ③访问数据表: sntl <- sqlFetch (channel, “数据表名”)数据预处理?缺失值处理: : ();sum(()) : ①删去有缺失值的行:data2<-data[!(),] ②替换缺失值: data[(data)]<-mean(SALARY[!(SALARY)]) ③多重插补法(通过变量间的关系预测缺失数据) a)随机模拟数据: imp<-mice( data,seed =1) b)线性回归: fit<-with( imp,lm (SALARY~WORK+PRICE)) c)回归结果: pooled<-pool(fit) d)手动计算预测结果数据预处理?数据整理: : 按列 cbind ();按行 rbind () : data2<-data[c(2,4),] —选取第二、四行 : ① <-order( data$SALARY ) ② data[ ,]—排序结果基本图形?条形图?饼图 None Some Marked 简单条形图 Improvement US20% UK24% Australia8% Germany32% France16% 饼图基本图形?直方图?点图 Histogram of mtcars$mpg mtcars$mpg 10 15 20 25 30 1 2 3 4 5 6 7 8 x

R语言入门总结 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数37
  • 收藏数0 收藏
  • 顶次数0
  • 上传人s0012230
  • 文件大小398 KB
  • 时间2017-01-21