下载此文档

运维考勤规范V.doc


文档分类:行业资料 | 页数:约40页 举报非法文档有奖
1/40
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/40 下载此文档
文档列表 文档介绍
运维驻场管理规
一、驻场服务介绍
为保证集中统一存储系统的软硬件产品、备份系统的正常运行,我方提供1名具备2年工作经验的工程师进行驻场服务。驻场服务地点为广电总局监管大楼18层,工作环境由数据中心提供。工作时间为法定工作日5*8小时、重大节日和数据中心规定的重要保障期7*24小时。驻场服务工程师需按规定完成常规巡检服务,并提交巡检报告;在设备(系统)出现故障时,最短时间恢复业务运行,并排除故障,编写故障报告。

浪潮提供1名驻场工程师,在法定工作日提供8小时现场值守服务,重大节日和重要保障期提供24小时现场值守服务。
驻场人员主要服务容包括但不限于如下容:
服务围的设备/系统日常运行维护,确保系统的可靠性和可用性;
备份软件客户端的维护;
随时了解用户对集中存储系统的访问需求,协助进行故障处理和应急处置,并及时反馈处置情况;
迅速、及时和准确的反馈和处理突发事件或紧急设备故障;
提供产品巡检日报、周报及月报;
完成投标方布置的相关工作。

日巡检:维保服务产品清单,提供巡检服务,对所有设备(系统)提供每个工作日2次常规巡检服务,并填写巡检报告;
周巡检:每周1次深度巡检服务,检查常规巡检报告,填写深度巡检报告;
月巡检:每月1次月度深度巡检服务,执行周巡检的所有容,制作性能曲线。
具体容如下:
:硬件设备及链路巡检
产品清单中的产品运行状态,检查各链路连接状态。记录设备清单列表中的设备状态指示灯的状态。
:集中存储系统巡检
检查磁盘阵列状态,包括RAID组的状态、卷的状态。检查存储文件系统的运行状态,包括MDS系统状态、挂在卷状态、SMB服务状态。记录存储系统的总量、增量、剩余量、OST卷的使用率、文件系统实时读写速率,并按照要求及时清理空间。




(在元数据节点上运行top命令)
HA状态
(在元数据节点上运行crm_mon命令)

(在接口节点上执行service smb status 命令)
、增量、剩余量、OST卷的使用率
(在接口节点上执行lfs df –h命令)

(在接口节点上执行service ctdb status命令)
:备份系统巡检
(,通过Xshell ,运行NBU备份软件)
检查磁带库中磁带的使用情况,磁带卷池的剩余容量。检查备份服务器的运行状态,检查备份文件备份及数据路备份作业是否正常执行,查看备份日志;若备份失败,应急情况下针对失败作业进行手动备份作业,并及时处理故障。记录检查结果和执行结果。
检查当天备份作业是否成功执行
检查剩余可用磁带数目
每月初手动设定新的备份策略,划分对应的资源池,保证备份作业的连续性。
根据带库容量,运维驻场人员要根据客户需求,完成磁带的入库、出库、过期等操作。
:工作要求
为保证集中统一存储系统的软硬件产品、备份系统的正常运行,我方提供1名具备5年工作经验的工程师与驻场工程师进行每周1次深度巡检服务,执行如下工作
执行日巡检容。
收集集中存储中MDS节点、OST节点、转换节点的日志并分析。
收集光纤交换机、以太网交换机、磁盘阵列日志并分析。
收集备份服务器及磁带库日志并分析。
根据日志分析结构,提供合理化建议方案。
根据客户需求,执行数据的删除,维护存储剩余空间。
分析结果若出现系统不可用现象,现场调查出现故障原因,记录出现时间,描述问题现象及影响,提出解决方案并现场解决问题。出局故障分析报告及故障,容包括故障信息描述、故障现象分析、故障造成的影响、故障导致损坏或丢失的文件列表、故障解决过程、问题改进措施等。
:收集日志并分析
分析结果若出现系统不可用现象,现场调查出现故障原因,记录出现时间,描述问题现象及影响,提出解决方案并现场解决问题。出局故障分析报告及故障,容包括故障信息描述、故障现象分析、故障造成的影响、故障导致损坏或丢失的文件列表、故障解决过程、问题改进措施等。
日志搜集方法如下:
登录到mds:
使用xshell ssh 到root目录下(cd /root);

运维考勤规范V 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数40
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2982835315
  • 文件大小1.59 MB
  • 时间2021-01-26