下载此文档

Spark效用感知的检查点缓存并行清理策略.pdf


文档分类:医学/心理学 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
计算机系统应用 ISSN 1003-3254, CODEN CSAOBN E-mail: ******@
Computer ts show
that in the multi-job execution environment based on fair scheduling, with the increase of the number of checkpoints, the
execution efficiency of the unoptimized program becomes worse. After using PCC strategy, the program execution time,
power consumption and GC time can be reduced by %, % and %, respectively. Effectively improve the
efficiency of multi-checkpoint program execution.
Key words: cache cleaning; Spark; utility entropy; failure checkpoint; parallel cleaning; big data
Spark是主流基于内存的大数据计算框架,因其低 系统正在迁移到Spark平台上,利用并行计算和内存
延时,高性能,生态丰富被广泛使用⑴传统的机器学**** 迭代等特点提升训练效率,优化Spark框架执行效能
①基金项目:河南省科技研发项目(2**********)
收稿时间:2021-06-23;修改时间:2021-07-14;采用时间:2021-08-10; csa在线出版时间:2022-03-22
Software Technique*Algorithm 软件技术•算法 253计算机系统应用 -s- 2022年第31卷第4期
可以节约用电成本,降低碳排放[2-4].基于内存迭代计 点是该策略无法感知分区数据是否使用完毕,未使用
算不具有稳定性,易发生数据丢失,在多次迭代计算中, [10]提出考虑任
RDD数据丢失会导致高度冗余计算,Spark引入检查 务的Locality Level因素综合计算代价、分区大小、
点机制避免因内存数据丢失导致的重复计算问题.

Spark效用感知的检查点缓存并行清理策略 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人好用的文档
  • 文件大小945 KB
  • 时间2022-05-19