下载此文档

智慧树知到《大数据工具应用》章节测试答案.pdf


文档分类:IT计算机 | 页数:约19页 举报非法文档有奖
1/19
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/19 下载此文档
文档列表 文档介绍
该【智慧树知到《大数据工具应用》章节测试答案 】是由【青山代下】上传分享,文档一共【19】页,该文档可以免费在线阅读,需要了解更多关于【智慧树知到《大数据工具应用》章节测试答案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..第一章1、2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和()能力的数据集。A:计算B:访问C:应用D:分析答案:分析2、用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和()。A:VarietyB:VainlyC:VagaryD:Valley答案:Variety3、大数据分析四个方面的工作主要是:数据分类、()、关联规则挖掘和时间序列预测。A:数据统计B:数据计算C:数据聚类D:数据清洗答案:数据聚类4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。A:对B:错:..答案:错5、目前的大数据处理技术只能处理结构化数据。A:对B:错答案:错第二章1、ess数据库软件的数据库文件格式后缀名是()。A:mdfB:mdbC:dbfD:xls答案:mdb2、大多数日志文件的后缀名是()。A:txtB:csvC:xmlD:log答案:log3、本课程重点介绍的weka软件的专有文件格式是()。A:MongoDBB:ARFFC:valueD:keymap:..答案:ARFF4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和()。A:专业性B:排他性C:一致性D:共享性答案:一致性5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个()来作为采集的目标。A:电话号码B:关键词C:网页地址D:用户名答案:网页地址6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是()。A:otdB:jpgC:pngD:gif答案:otd7、Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。A:对B:错:..答案:对8、Excel不能导入txt或csv格式的文件。A:对B:错答案:错9、八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。A:对B:错答案:错10、八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。A:对B:错答案:对第三章1、使用DBSCAN算法对鸢尾花数据集()进行聚类,,minPoints参数设置为5,忽略class属性,那么将形成()个簇。A:1B:2C:3D:4:..答案:32、使用EM算法对天气数据集()进行聚类,将numClusters设置为4,即簇数为4,其他参数保持默认值,忽略class属性,从结果中可知,下列选项中,()是错误的。A:模型的最大似然估计值是-:这组数据用算法迭代15次C::第四个簇的实例数为4答案:第四个簇的实例数为43、使用SimpleKMeans算法对天气数据集()进行聚类,保持默认参数,即3个簇以及欧氏距离。选择play属性为忽略属性,从结果中可知,下列选项中,()是错误。A:这组数据用算法迭代四次B:产生了三个中心点C:聚合为3个簇,分别有7,3,4个实例D::这组数据用算法迭代四次4、使用线性回归(LinearRegression),由其输出的误差指标可知()。A:LinearRegression的标准误差比M5P的标准误差小B:LinearRegression的平均绝对误差比M5P的平均绝对误差小C:LinearRegression的相对误差比M5P的相对误差小D:LinearRegression的平均方根误差比M5P的平均方根误差大答案:LinearRegression的平均方根误差比M5P的平均方根误差大5、,使用M5P分类器构建方案,在结果中,到达:..LM2的实例数有()个。A:165B:21C:23D:30答案:216、,当outlook=sunny;temperature=cool;humidity=high;windy=TRUE时,分类的结果是()。A:YesB:NoC:没有结果D:无法分类答案:No7、,当sepallength=;sepalwidth=;petallength=;petalwidth=,分类的结果是()。A:Iris-setosaB:Iris-versicolorC:Iris-virginicaD:无法分类答案:Iris-setosa8、关于Weka离散化说明正确的是()。A:离散化是将数值属性转换为字符串型属性B:有监督离散化有两种等宽和等频方法C:等宽离散化是使实例分布均匀的:..D:离散化包括无监督离散化和有监督离散化答案:离散化包括无监督离散化和有监督离散化9、以下()不是Weka的数据类型。A:numericB:nominalC:stringD:decimal答案:decimal10、关于Weka的文件类型描述错误的是()。A:、.csv、.xlsxB:Weka处理的数据集类似于关系数据库横行实例,竖行属性C:arff是ASCII文件,可以用Word等文本编辑器打开查看D:***@relation定义数据集名称,***@data之后呈现实例,每一行就是一个实例答案:、.csv、.xlsx11、以下属于关联分析的是()。A:CPU性能预测B:购物篮分析C:自动判断鸢尾花类别D:股票趋势建模答案:购物篮分析12、大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下()算法直接挖掘。:..A:K-meansB:workC::Apriori答案:Apriori13、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的()问题。A:关联规则发现B:聚类C:分类D:自然语言处理答案:关联规则发现14、在进行自动选择属性时,必须设立两个对象,其中确定使用什么方法为每个属性子集分配一个评估值的对象是下面的()。A:搜索方法B:属性评估器C:元分类器D:规则挖掘答案:属性评估器15、以下属于属性空间的搜索方法的是()。A:GainRatioAttributeEvalB:BestFirstC:ponentsD:SymmetricalUncertAttributeEval:..答案:BestFirst16、在weka软件探索者界面中,利用Visualize标签页通过更改各个参数来进行数据集的可视化属性设置后,需要单击以下()按钮,所有更改才会生效。A:SelectAttributeB:SubSampleC:UpdateD:Fastscrolling答案:Update17、给定关联规则AB,意味着:若A发生,B也会发生。A:对B:错答案:错18、支持度是衡量关联规则重要性的一个指标。A:对B:错答案:对19、Ranker方法既可以用于单个属性评估器,又可以用于属性子集评估器。A:对B:错答案:错20、利用weka软件进行数据可视化时,用户可以选择类别属性对数据点着色,如果类别属性是标称型,则显示为彩色条。A:对:..答案:错第四章1、贝叶斯网络中的节点代表()。A:变量B:随机过程C:随机变量D:随机函数答案:随机变量2、贝叶斯网络中,节点需给出概率分布描述,对于离散型随机变量而言,可以用(式表)的形示。A:条件概率密度函数B:正态分布C:条件概率表D:均匀分布答案:条件概率表3、贝叶斯网络中节点之间的边代表()。A:随机关系B:概率因果C:组合关系D:随机结果答案:随机关系4、贝叶斯网络保存的文件格式是()。:..B:DOCXC:TXTD:XLS:XMLBIF5、下面()不是反向传播神经网络的结构。A:输入层B:隐含层C:计算层D:输出层答案:计算层6、神经网络中的节点代表()。A:激励变量B:激励函数C:随机变量D:随机函数答案:激励函数7、下列()不是常见的激励函数。A:线性函数B:Sigmoid函数:..D:正弦函数答案:正弦函数8、在贝叶斯网络编辑界面时,如果节点的名称没法完全显示,需要从()菜单项进行调整。A:Tools|SetDataB:View|ZoomOutC:View|ZoomInD:Tools|Layout答案:Tools|Layout9、WEKA中选择神经网络分类器操作时,应该选择()。A:rules条目下的PARTB:functions条目下的SGD分类器C:functions条目下的MultilayerPerceptron分类器D:默认的分类器答案:functions条目下的MultilayerPerceptron分类器10、下面关于PackageManager安装后的目录说明不正确的是()。A:doc子目录存放API文档B:lib子目录存放包所需要的说明文件C:sample-data子目录存放数据集文件D:src子目录存放源代码文件答案:lib子目录存放包所需要的说明文件第五章1、Tableau是一款定位于数据可视化敏捷开发和实现()展现工具。在Tableau连续第6年Gartner分析和商业智能魔力象限中蝉联领导者殊荣。:..商务智能B:商业行为C:商务计算D:商业统计答案:商务智能2、以下()不是Tableau的数据类型?A:BooleanB:DateC:StringD:Decimal答案:Decimal3、Tableau可以用来实现交互的、()的分析和仪表板应用,从而帮助我们快速地认识和理解数据。A:连续性B:离散性C:智能化D:可视化答案:可视化4、下列说法错误的是()。A:Tableau通过内存数据引擎,可以直接查询外部数据库同时动态的从数据仓库抽取实时数据,极大的提高了数据访问和查询效率B:用户仅需要通过轻点鼠标和简单拖放就可以迅速创建出智能、精美、直观和具有强交互性的报表和仪表盘C:Tableau允许从多个数据源访问数据,包括带分隔符的文本文件、Excel文件、SQL数据库、Oracle数据库和多维数据库等:..答案:5、度量往往是()字段,度量是我们的指标。度量常常是连续的,,Tableau默认会进行()。A:数值,聚合运算B:数值,混合运算C:分类,聚合运算D:分类,混合运算答案:数值,聚合运算6、关于数据分层描述错误的是()。A:数据分层可以实现向上钻取B:数据分层可以实现向下钻取C:数据分层的层级结构由数据维度的上下顺序决定D:数据分层的层次结构可以手工调整答案:数据分层可以实现向上钻取7、以下不属于集的创建方式的是()。A:[常规]创建B:[条件]创建C:[顶部]创建D:[分组]创建答案:[分组]创建8、Tableau右边数据目录栏中,不能单击右键创建参数的纬度是()A:纬度:..C:集D:参数答案:集9、以下不是创建计算字段时的运算逻辑的是()。A:数字B:日期C:用户D:表结构答案:表结构10、仪表板版面大小设计选项,()不属于大小设计选项。A:固定大小B:自动C:范围D:自定义答案:自定义1、Logistic函数的定义域是()A:(-INF,+INF)B:[0,1]C:(0,+INF)D:(-INF,1)答案:(-INF,+INF):..2、下列叙述错误的是()。A:逻辑回归是一种监督机器学****算法B:逻辑回归主要用于回归分析C:逻辑回归采用Sigmoid函数对样本数据进行拟合,以构建回归模型D:逻辑回归预测事件发生的概率并分析导致事件发生的因素答案:尺寸线用细点画线表示3、,由其输出的结果可知()A:IBk正确分类百分比比SMC大B:IBk对republican的分类正确率比SMC大C:SMC对democrat的分类正确率比IBk小D:SMC对democrat和republican的分类正确率都比IBk大答案:SMC对democrat和republican的分类正确率都比IBk大4、:0或1B:0或-1C:1或-1D:true或false答案:5、以下描述错误的是()A:SVM对噪声不具备鲁棒性B:SVM寻找具有最小边缘的超平面,因此经常被称为最小边缘分类器C:k-最近邻算法(K-NN)是一种消极学****器:..D:聚类分析可以看作是一种非监督的分类答案:6、线性支持向量机的最大化间隔正确的描述是()。A:::::7、以下计算距离的公式中,计算欧氏距离的是()。A:::::第七章1、一般情况下在作图时先不添加()区。A:坐标轴B:绘图区C:标题区D:图例区答案:标题区2、连续性单变量图不包括()。:..A:直方图B:箱线图C:P-P图D:条形图答案:条形图3、两个定性变量可选择的作图不包括()。A:复式条形图B:散点图C:堆叠条形图D:马赛克图答案:散点图4、堆叠条形图和马赛克图可以在图形属性中直接转换。A:对B:错答案:对5、定性变量作定量变量的相应图形也是有意义的。A:对B:错答案:错6、多维度数据图形一般还是以二维的形式展示,只通过形状、颜色等要素扩展维度信息。A:对B:错答案:对:..7、制作统计图有两个基本要求:一是正确,二是简洁。A:对B:错

智慧树知到《大数据工具应用》章节测试答案 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数19
  • 收藏数0 收藏
  • 顶次数0
  • 上传人青山代下
  • 文件大小1.38 MB
  • 时间2024-03-29