下载此文档

基于spark构建即席查询平台(ppt课件).ppt


文档分类:文学/艺术/军事/历史 | 页数:约24页 举报非法文档有奖
1/24
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/24 下载此文档
文档列表 文档介绍
基于Spark构建即席查询平台
自我介绍
基础架构部分布式计算团队孙垚光
09年-11年:Linux内核网络协议栈优化
11年-今:分布式计算批处理/内存计算/流式等
目录
即席查询
为什么是Spark
基于Spark,我们做了什么
应用案例
后续规划
即席查询
面向“人”的查询
即席(Ad-Hoc):
查询模式相对不固定
数据没有(时间/成本)做过多预处理
数据暂时不知如何处理
交互式(Interactive)
查询具有较高时效性
为什么是Spark
MPP vs Hadoop
MPP(Impala)
Hadoop(Hive/SparkSQL)
扩展性
1000台以内/PB以下
千台以上/PB以上
查询延迟
毫秒~秒
秒~分钟
架构复杂性
中等
复杂
容错


调度策略
Gang/Transaction
分批调度
与存储结合程度
紧密
一般
基于Spark我们做了什么
更易用
更稳定
安全/资源隔离
性能/时效性
整体架构
基于Spark我们做了什么
更易用
Platform as a Service
用户不再关心部署/升级/调参/监控
各种形式的API
Web/CLI/JDBC/SDK/Tools等
合理/简洁的概念抽象
Resource/Project/Dataset/Table/Partition
账单
Query粒度的资源消耗
基于Spark我们做了什么
更稳定
接入层无单点
Query持久化
支持Query返回大量数据
各用户保证Quota
多种维度的监控
安全/资源隔离
基于Cgroup/Namespace的Container隔离
CPU/Memory/FS
Container本身的加固
网络的互通与隔离
基于JVM沙箱层的多种安全策略
计算/存储框架层的安全认证和加密传输
基于Spark我们做了什么

基于spark构建即席查询平台(ppt课件) 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数24
  • 收藏数0 收藏
  • 顶次数0
  • 上传人1017848967
  • 文件大小1.51 MB
  • 时间2017-09-20
最近更新