下载此文档

机群作业管理系统condor 综述[j].doc


文档分类:高等教育 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍
本文档下载自文库下载网,内容可能不完整,您可以点击以下网址继续阅读或下载:
/
机群作业管理系统Condor综述
第5卷第1期 2004年3月信息工程大学学报 JournalofInformationEngineeringUniversity
机群作业管理系统Condor综述
郭绍忠,黄永忠,余丽琼
(信息工程大学信息工程学院,河南郑州450002)
摘要:文章简要地介绍了机群计算机系统结构,机群作业管理系统的一个实例Condor,分析了Condor的特点,Condor系统的组成结构和核心进程,Condor进程的运行;最后给出Condor在设置检查点的一些局限性。
关键词:机群计算机;Condor;高吞吐量计算(HTC);检查点
中图分类号:TP393 文献标识码:A 文章编号:1671-0673(2004)01-0073-04
ResearchandAnalysisonClusterJobManagementSystemCondor
GUOShao_zhong,HUANGYong_zhong,YULi_qiong
(InstituteofInformationEngineering,InformationEngineeringUniversity,Zhengzhou450002,China)
Abstract:puters,,,itlistssomelimitationsoftheCondor.
Keywords:clusters;Condor;puting/(HTC);checkpoint
112 Condor概述
Condor是由美国威斯康星大学开发的机群作业管理系统,该项目得到美国政府(国防部、能源
111 机群计算机系统及其结构
机群是一种并行或分布式处理系统,由很多连
接在一起的独立的计算机组成,像一个单独集成的计算资源一样协同工作。计算节点可以是一个单处理器的系统(PC、工作站或SMP),拥有内存、I/O设备和操作系统。一个机群一般是指连接在一起的两个或多个计算机(节点)。节点可以是在一起的,也可以是物理上分散而通过LAN连接在一起的。一个连接在一起的计算机机群对于用户和应用程序来说就像一个单一的系统,这样可以为用户提供价格合理且快速而可靠的服务。机群提供高性能、可扩展性、高吞吐量计算HTC(HighThrough-puting)和易用性,所以机群受到越来越多业界人士的欢迎。典型的机群系统的体系结构,如图1。
部、美国国家宇航局、国家科学基金)和众多企业(AT&T,IBM,INTEL,MicrosoftUW-Madison)的资助。安装在威斯康星大学计算科学系的Condor资源计算池由超过700个Unix工作站,100个Windows2000PC组成,平均每天该资源池能向研究人员和用户提供超过500个CPU工作日的利用价值。目前全世界已经有上百个科研院所安装了Condor系统。
Condor管理一个专用于某类计算的工作站群(机群),它能有效地利用网络中能相互通讯的工作站的计算力,创造一个高吞吐量计算HTC环境,这些机器可能分布于不同的地域,分别属于不同的用户。pute-intensive)分布式机群作业的批处理系统。如果一个实验程序需要成千上万次不同的输入状态下的
1机群计算机系统及Condor简介
收稿日期:2003-06-24
:),,,
74 信息工程大学学报
2004年
:/// 机群计算机体系结构
运行,每次提供的输入数据不同(如600组数据),Condor可以仅用一个命令,来提交这600个作业,并且可以动态、实时地监控这600个作业的运行状态,系统自动地为这600个作业进行审核和记日志。
(4)作业可以排序作业可以按安排好的顺序执行,一系列作业由有向非循环图(DAG)来详细说明,图中每个节点代表一个作业,作业按照该图给的指示有序提交给Condor。
(5)ClassAds ClassAds类似于报纸中将广告分类的方式,资源提供方提供资源池中所有机器的特征,包括静态和动态的,如内存、CPU型号、速度、虚拟内存大小、物

机群作业管理系统condor 综述[j] 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人sdhdjhty
  • 文件大小0 KB
  • 时间2015-10-19
最近更新