登录
|
注册
|
QQ账号登录
|
常见问题
联系我们:
我要上传
首页
浏览
幼儿/小学教育
中学教育
高等教育
研究生考试
外语学习
资格/认证考试
论文
IT计算机
经济/贸易/财会
管理/人力资源
建筑/环境
汽车/机械/制造
研究报告
办公文档
生活休闲
金融/股票/期货
法律/法学
通信/电子
医学/心理学
行业资料
文学/艺术/军事/历史
我的淘豆
我要上传
帮助中心
复制
下载此文档
如何将 MapReduce 转化为 Spark.pdf
文档分类:
IT计算机
|
页数:约11页
举报非法文档有奖
分享到:
1
/
11
下载此文档
搜索
下载此文档
关闭预览
下载提示
1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档,不会出现我们的网址水印。
同意并开始全文预览
(约 1-6 秒)
下载文档到电脑,查找使用更方便
下 载
还剩?页未读,
继续阅读
分享到:
1
/
11
下载此文档
文档列表
文档介绍
如何将 MapReduce 转化为 Spark.pdf
: .
如何将 MapReduce 转化为 Spark
本文首先对 MapReduce 和 Spark 的基本信息做了对比性介绍,接着分别对 MapReduce 和
Spark 进行基础性知识讲解,然后在单台 Linux 服务器上安装了 Spark,并以实际代码演示了从
MapReduce 转换代码到 Spark 时需要注意的事项。本文针对的是对 Spark 完全没有了解的用户,后
续文章会从实际应用出发,从安装、应用程序的角度给出更加实用的教程。
MapReduce VS Spark
目前的大数据处理可以分为以下三个类型:
(batch data processing),通常的时间跨度在数十分钟到数小时之间;
(interactive query),通常的时间跨度在数十秒到数分钟之间;
(streaming data processing),通常的时间跨度在数百毫秒到
数秒之间。
大数据处理势必需要依赖集群环境,而集群环境有三大挑战,分别是并行化、单点失败处理、资
源共享,分别可以采用以并行化的方式重写应用程序、对单点失败的处理方式、动态地进行计算资源
的分配等解决方案来面对挑战。
针对集群环境出现了大量的大数据编程框架,首先是 Google 的 MapReduce,它给我们展示了一
个简单通用和自动容错的批处理计算模型。但是对于其他类型的计算,比如交互式和流式计算,
MapReduce 并不适合。这也导致了大量的不同于 MapReduce 的专有的数据处理模型的出现,比如
Storm、Impala 等等。但是这些专有系统也存在一些不足:
重复工作:许多专有系统在解决同样的问题,比如分布式作业以及容错,举例来说,一个分布式
的 SQL 引擎或者一个机器学****系统都需要实现并行聚合,这些问题在每个专有系统中会重复地被解
决。
组合问题:在不同的系统之间进行组合计算是一件麻烦的事情。对于特定的大数据应用程序而言,
中间数据集是非常大的,而且移动的成本很高。在目前的环境下,我们需要将数据复制到稳定的存储
系统,比如 HDFS,以便在不同的计算引擎中进行分享。然而,这样的复制可能比真正的计算所花费
的代价要大,所以以流水线的形式将多个系统组合起来效率并不高。
适用范围的局限性:如果一个应用不适合一个专有的计算系统,那么使用者只能换一个系统,或
者重写一个新的计算系统。
资源分配:在不同的计算引擎之间进行资源的动态共享比较困难,因为大多数的计算引擎都会假设它
们在程序运行结束之前拥有相同的机器节点的资源。
管理问题:对于多个专有系统,需要花费更多的精力和
如何将 MapReduce 转化为 Spark 来自淘豆网www.taodocs.com转载请标明出处.
猜你喜欢
建筑安全员考试题库1套
141页
2024年足球知识题库最新
12页
中国历史文化知识竞赛100题【易错题】
14页
马原考试复习题500道含答案【考试直接用】
95页
县乡教师选调考试《教师职业道德》题库含完整..
42页
县乡教师选调进城考试《教育心理学》题库及完..
120页
沪科版九年级上册数学22.1《比例线段》-(共35..
24页
县乡教师选调进城考试《教育法律法规》题库附..
133页
科普知识竞赛题库100道精品【能力提升】
18页
火灾化学—第四讲课件
28页
环椎骨折手术-课件
32页
饮料行业的数据挖掘与人工智能应用
28页
糖尿病足得护理措施
31页
痉挛型双瘫的康复治疗
33页
水痘病发证状
33页
相关文档
更多>>
非法内容举报中心
文档信息
页数
:
11
收藏数
:
0
收藏
顶次数
:
0
顶
上传人
:
湘云
文件大小
:
184 KB
时间
:
2021-12-28
相关标签
贫困户调查问卷
洗面奶调查问卷
经济类调查问卷
关于早餐的调查问卷
关于理想的调查问卷
天然气安全知识问卷
形势与政策调查问卷
保温杯调查问卷
培训效果评估调查问卷
畜牧业调查问卷
计算机原理
PHP资料
linux/Unix相关
C/C++资料
Java
.NET
windows相关
开发文档
管理信息系统
软件工程
网络信息安全
网络与通信
图形图像
行业软件
人工智能
计算机辅助设计
多媒体
软件测试
计算机硬件与维护
网站策划/UE
网页设计/UI
网吧管理
电子支付
搜索引擎优化
服务器
电子商务
Visual Basic
数据挖掘与模式识别
数据库
Web服务
网络资源
Delphi/Perl
Python
CSS/Script
Flash/Flex
手机开发
UML理论/建模
并行计算/云计算
嵌入式开发
计算机应用/办公自动化
SEO
最近更新
2024年有趣的夏天小学生作文
小班美术教案小蜗牛(1)
2024年有感染力的安全口号44条
2024年有哲理的句子关于青春励志
2024年有创意的自我介绍女生(精选19篇)
小班美术教案《可爱的蚕宝宝》
2024年有关黄河的谚语
2024年有关高中自我鉴定汇总9篇
小班美术公开课爱吃糖葫芦的太阳公公教案反..
小班美术公开课教案及教学反思《装饰鸡蛋宝..
2024年有关风俗习惯作文300字集合五篇
小班美术公开课教案及教学反思《小瓶盖创意..
2024年有关难忘话题作文三篇
2024年有关防暑降温应急预案(通用5篇)
小班美术优质教案《红蛋太阳》
2024年有关铅笔的作文300字四篇
2024年有关金融工作计划模板五篇
小班科学课件《有趣的小镜子》PPT课件(1)
2024年有关采购合同汇编五篇
小班科学游戏教案(1)
变压器及高低压柜吊装施工方案
执业兽医题库3000题(有答案)
蔬果的损耗控制方法
辩论赛------------小学生该不该上补习班(共..
智能消杀机器人控制系统设计
办公室收文处理流程
冠心病稳定性心绞痛教学查房
网络数字暗语
工程-屋面采光顶张悬梁安装方案
【经验】BJL赢钱注码法
在线
客服
微信
客服
QQ
客服
意见
反馈
手机
查看
返回
顶部