会计学
1
大数据计算模式和关键技术
1
大数据关键技术
1、数据采集
2、数据存储与管理
3、数据处理与分析
4、数据隐私与安全
分布式存储
分布式处理
大数据
两大核心技术
分布式存储:解决海量数据的存储问题
单机无法存储
集群分布式存储
海量数据的存储
大数据技术都是以Google公司技术为代表
1
分布式数据库Bigtable
分布式文件系统GFS
分布式并行处理技术Mapreduce
正如“不同的锁需要不同的钥匙”企业中不同的应用场景数据不同的计算模式,需要使用不同的大数据技术
不同的计算模式需要使用不同的产品
1
大数据关键技术
批处理
流数据需要实时处理
图计算需要实时处理
实时计算
交互式查询分析
交互式计算
不同的计算模式需要使用不同的产品
MapReduce批处理计算模式的典型代表
批处理计算
MapReduce是批处理计算模式的典型代表
可做迭代计算的Spark,实时性更好
流计算
代表技术:Storm、S4、Flume、Streams
流数据(网购数据、游戏内玩家活动、社交网站信息、金融交易大厅或地理空间服务,以及来自数据中心内所连接设备或仪器的遥测数据)需要实时处理,给出实时响应,否则分析结果会失去商业价值。
大数据计算模式和关键技术PPT教案 来自淘豆网www.taodocs.com转载请标明出处.