下载此文档

《Spark编程基础及项目实践》课后习题及答案8.docx


文档分类:IT计算机 | 页数:约2页 举报非法文档有奖
1/2
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/2 下载此文档
文档列表 文档介绍
****题8
L选择题
(1)按照任务划分,以下不是机器学****模型的是(D )




(2)以下不是MLlib数据类型的是(D )o



L选择题
(1)按照任务划分,以下不是机器学****模型的是(D )




(2)以下不是MLlib数据类型的是(D )o




(3)如果想把一列特征进行数值化,使得相应的特征索引化要使用什么方法(A )o
Stringindexer
IndexToString
StandardScaler
Vectorindexer
(4)下面哪个不是MLlib的特征选择方法(B )o
A. VectoerSlicer
B. KafSelector
C. Rformula
D. ChiSqSelector
(5)在特征提取过程中,通过计数方法将一组文本文档转换为向量使用什么方法(D )。
A. CountCentorizer
Stringlndexer
StringVector
Tokenizer 2 .操作题
使用Hadoop用户名登录Linux系统,启动Spark-shell,使用Hadoop提供的Shell完成 如下操作:
(1)下载数据集 ,该数据集为莺尾花数据统计,然后对这些数据集进行统计工作:数据数量、每一列最大值、 最小值、均值、方差。
import .{MultivariateStatisticalSummary, Statistics} val observations=("G:/spark/").map((",")).map(p => (p(0).toDouble, p(l).toDouble/ p(2).toDouble, p(3).toDouble)) v

《Spark编程基础及项目实践》课后习题及答案8 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数2
  • 收藏数0 收藏
  • 顶次数0
  • 上传人1772186****
  • 文件大小11 KB
  • 时间2022-06-25