下载此文档

大数据基础与应用北京理工大学中国大学mooc课后章节答案期末考试题库2023年.pdf

文档分类：高等教育 | 页数：约18页举报非法文档有奖

1/18

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/18 下载此文档

文档列表 文档介绍

该【大数据基础与应用北京理工大学中国大学mooc课后章节答案期末考试题库2023年】是由【青山代下】上传分享，文档一共【18】页，该文档可以免费在线阅读，需要了解更多关于【大数据基础与应用北京理工大学中国大学mooc课后章节答案期末考试题库2023年】的内容，可以使用淘豆网的站内搜索功能，选择自己适合的文档，以下文字是截取该文章内的部分文字，如需要获得完整电子版，请下载此文档到您的设备，方便您编辑和打印。:..北京理工大学中国大学mooc课后章节答案期末考试题库2023年大数据的特性不包括答案:、分布式、基于发布订阅的消息系统,利用Kafka技术可在廉价PCServer上搭建起大规模消息系统。答案:。答案:?答案:数据采集、数据清洗、数据管理、数据分析、:答案:大数据分析的对象是大规模类型多样的海量数据,使用的模型较为复杂;而传统数据分析则作用在有限的小规模数据集上,模型较为简单。传统数据分析主要是描述性分析和诊断性分析,而大数据分析主要是预测性分析。_大数据分析主要是为了发现新的规律和知识,而传统数据分析主要是为了了解正在发生的事件及其原因。:..、技术、算法和分析方法来对这些数据进行采集、存储和关联分析,以期望能够从中抽取出隐藏的有价值的信息。答案:、构建、测试和维护系统,比如数据库和大规模处理系统答案:。答案:?答案::答案:表(Tables)_桶(Buckets)_分区(Partitions):..NoSQL答案:,不属于Python内置数据类型的是:答案:::数据获取、数据清洗、数据分析、(cm)数据如下:176、165、173、168、176、180、177、168、174、176,则其众数和中位数分别是:答案:176,:数据可视化:..:(有监督学****模型答案::?答案::()操作后,再次对其进行一次输出,则输出结果与原字符串:..{10,12,16,18,22,35,45,50,90,100}的p=40%的截断均值_____答案:()答案:模型在训练集上表现的很好,:_____、______答案:,已知A区两点分别(2,5)和(1,4),B区(8,1)和(9,2),若使用KNN算法(距离使用欧氏距离【图片】),求M(4,3)属于哪一区?答案::答案:Flume适用于大量数据的实时数据采集:..Kafka的说法不正确的是:答案:主要是使用c++、:答案:HDFS支持多用户写入,、负责客户端请求响应的节点是:答案:()默认的块大小是:答案::答案:=(20).reshape((4,5)),则p[3][2]的值是。答案:17:..HBase答案::答案::。答案:()答案:-means算法的基本步骤的是()答案:将数据集中全部元素按照新的中心重新聚类_从数据集中随机取k个对象,作为k个簇的初始聚类中心_根据聚类结果,更新k个簇的中心,计算方法:..计算剩下的对象到k个簇中心的相似度,()答案:()答案:mode(),其中包含name和age两列100行数据。则下列表达式中,:d[2,’name’]。答案:错误44.“尿布与啤酒”案例属于哪种机器学****的典型任务?答案:关联:..“”场景属于哪种机器学****的典型任务?答案:()答案:,经常会遇到重复值。下列说法中错误的是答案:duplicated()返回值中用1表示重复,,下列函数可以在图像中任意位置显示文字的是答案:text():([x],y,[format],…),下列说法错误的是答案::①提供一个第三方python库,调用库中方法可以直接返回DataFrame对象;②提供一个网站api,可以返回json格式字符串;③提供静态页面,内含表格数据;④提供查询功能,使用JavaScript动态脚本生成查询结果。假设上述各种服务样式均可返回所:..答案:,字典dict将被转换为答案:,应使用的函数为()答案:,完全可以代替ndarry这种数组。答案:,每一列可以为不同的值类型,但一列之内的类型必须相同。答案:,即使使用withas语句也应该调用close()方法显式关闭文件,以保证文件安全。答案:错误:..,但value可以是字典类型。答案:()答案:使用捕获异常_发生异常时需要捕获并处理,否则程序会终止执行_异常是一个Python对象,?()答案:使用split()()答案:,其默认索引值是0到n-1可以参与运算,而自定义索引值不会参与运算。答案:错误:..numpy的ndarray对象时,可以改变数组维度。下列描述中错误的是答案:(0,100):?答案:-means算法属于分类算法。答案:,可以使用glob完成文件查找功能。下列有关glob的说法中,错误的是答案:glob为内置库,={'a':1,'b':2}=['a']==n1['a']+n2['a'](s)代码的结果是?答案:10:..=[1,2,[3]]=m[:][1]=[2][0]=(m)答案::的执行结果是答案:()答案:()答案:理解一个文档_将内容相似的文档分组_找出文档或文档集中最重要的信息并用简洁连贯的短文进行表示70.“垃圾邮件的处理”场景属于哪种机器学****的典型任务?答案:():..方差就是标准差的平方72.“二手车价格预测”场景属于哪种机器学****的典型任务?答案:,分别计算两组年收入数据的方差。第一组:99个年收入10万的人和1个年收入1000万的人,第二组:。答案::()答案:()答案:根据给定的训练数据集构建一个决策树模型,使它能够对实例进行正确的分类:..77.{1,3,7,9,0,3,5}的中列数。答案:{10,12,13,14,25,30,40,50,90,100}的p=40%的截断均值。(保留2位小数)答案::1500、750、780、1080、850、960、2000、1250、1630,请计算该组数据的四分位数。(请使用较准确的位置确定方法。)答案:~1或-1~-。答案:,进行描述性统计,分析开发潜在的价值,构建模型解决商业问题。答案:错误:..10个家庭的人均月收入数据分别为:660、750、780、850、960、1080、1250、1500、1630、2000,请计算该组数据的中位数。答案:,用()更加具有实际意义。答案:。答案:,则并表明该组数据为扁平分布或者平峰分布。答案:。答案:,哪一项是正确的?答案:业务理解、数据理解、数据准备、建立模型、模型评估:..,可以使用subplots和subplot方法。如:,ax=subplot(rows,cols)答案:,可以使用fillna,但该方法只能为整个DataFrame设置相同的补全值。答案:,可以加载到BeautifulSoup库中,形成一个树状的HTML页面结构,供用户检索使用。答案:({'name':'David','age':20})将一个Python对象转为一个JSON字符串。答案:。若df为一个DataFrame对象,则对其描述中错误的是答案:排序时无论是升序还是降序,统一排到序列的开头部分:..:。答案::,而大数据分析主要目的是预测性分析。答案:[-1]访问时返回的字母为()答案:

大数据基础与应用北京理工大学中国大学mooc课后章节答案期末考试题库2023年来自淘豆网www.taodocs.com转载请标明出处.

大数据基础与应用 北京理工大学中国大学mooc课后章节答案期末考试题库2023年.pdf

大数据基础与应用北京理工大学中国大学mooc课后章节答案期末考试题库2023年.pdf