下载此文档

软件平台运维技术方案总体方案.pdf


文档分类:IT计算机 | 页数:约18页 举报非法文档有奖
1/18
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/18 下载此文档
文档列表 文档介绍
该【软件平台运维技术方案总体方案 】是由【青山代下】上传分享,文档一共【18】页,该文档可以免费在线阅读,需要了解更多关于【软件平台运维技术方案总体方案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..技术方案总体维护方案全面保障招标人信息、应用系统平稳运行及有效应用,总体目标如下:,(de)运维机制,包括运维团队、运维方案、运维制度、应急预案等:(de)系统故障、,(包括存储)可用率不低于%.主机系统可用率=(总时间-主机计划外停机时间)/总时间100%.应用系统可用率不低于%.应用系统可用率=(总时间-计划外停机时间)/总时间100%.网络可用率不低于%.信息网络可用率=(总时间-计划外网络中断时间)/总时间100%,有问必答,用语规范,态度诚恳,耐心解答用户疑难,虚心听取用户意见,处理业务不拖拉,%(de)问题占全部问题(de)比重不得低于80%;在一个小时内响应(de)问题占全部问题(de)比重不得低于95%;客户端、网络、用户管理、权限变更、操作类问题一个工作日内解决,业务流程、系统配置、权限设计类问题视问题(de)情况,一般在5个工作日内解决,系统变更业务审批在5个工作日内完成,新需求、,以便在发生错误时能够快速地恢复:...软件系统故障时,自动恢复时间<30分钟,手工恢复时间<,包含在运行维护服务中,帮助我们对用户现有(de)信息资产情况进行了解,更好(de)提供系统(de):后台管理系统数据信息统计记录门户网站信息发布安全管理系统新增功能接口对接及研发软件产品型号、版本和补丁等信息统计记录网络结构、网络路由、网络IP地址统计记录其它附属数据(de)统计记录网络、安全系统运维服务从网络(de)连通性、网络(de)性能、网络(de)监控管理三个方面实现对网络系统(de)、安全系统基本服务内容:序服务模块内容描述号配合用户进行,云服务器后买,1云服务器配置安装部署,调试等工作2系统故障诊断按服务级别:7×24小时:..×8小时3远程技术支持7×24小时对遇到(de)问题进行汇总和发4系统问题管理布(1)用户现场技术人员值守公司可根据用户(de)需求提供长期(de)用户现场技术人员值守服务,保证网络(de)实时连通和可用,(de)技术人员每天记录信息系统是否存在安全性及健壮性问题,网络(de)转发和路由是否正常进行,进行整体网络性能评估,针对网络(de)利用率进行优化并提出网络扩容和优化(de)(de)日常运行状态(de)监控,对各种安全设备(de)日志检查,对重点事件进行记录,对安全事件(de)产生原因进行判断和解决,及时发现问题,(de)运行数据进行记录,形成报表进行统计分析,便于进行网络系统(de)分析和故障(de)(de)数据包括:配置数据性能数据故障数据(2)网络运行分析与管理服务网络运行分析与管理服务是指公司工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议(de)一种综合性高级服务,其内容包括::..(de)技术问题,,最大程度减少网络故障隐患,更高效(de)进行网络管理.(3)重要时刻专人值守服务公司深刻知道保证重要时刻系统稳定运行对客户成功尤为关键,因此,公司可对客户提供重要时刻(de)专人现场值守支持,包括政府客户(de)重大会议期间、金融客户(de)年终结算日、运营商客户(de)生产网重大割接或其它任何客户认为可能对其业务运营产生重大影响(de),,(de)更多值守支持,:存储设备(de)日常监控,设备(de)运行状态监控,故障处理,操作系统维护,::..服务模块内容描述号配合用户进行,云服务器后买,安装部署,调1云服务器配置试等工作消除软件漏洞给系统带来(de)安全隐患,并2补丁服务对安装补丁所引起(de)系统连锁反应进行合理(de)(de)升级,以改进、3升级服务完善现有系统或消除现有系统(de):7×24小时4系统故障诊断5×8小时5远程技术支持7×24小时6系统问题管理对遇到(de)问题进行汇总和发布对客户系统(de)存储设备、操作系统、(de)内容包括:CPU性能管理;内存使用情况管理;硬盘利用情况管理;系统进程管理;服务器性能管理;:..监控网卡状态;系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);对存储(de)性能(如高速缓存、光纤通道等)进行监控.:..系统管理单位:设备型设备序设备名:号管理IP:列号参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期▅正常□异CPU状态常▅正常□异内存状态常运行状态▅正常□异磁盘状态常▅正常□异网卡状态常▅正常□异系统日志常文件系统,包系统▅正常□异括磁盘卷剩检查常余空间▅正常□异交换分区常:..系统管理单位:设备型设备序设备名:号管理IP:列号参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期▅正常□异固件版本常▅正常□异补丁包版本常▅正常□异系统镜像常▅正常□异存储磁盘常▅正常□异存储驱动常▅正常□异进程状态常▅正常□异系统CPU利用率常性能检查内存利用率▅正常□异:..系统管理单位:设备型设备序设备名:号管理IP:列号参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期常磁盘I/O性▅正常□异能常数据库安装▅正常□异数据目录常库运行状数据库进程▅正常□异态状态常集群进程状▅正常□异态常集群检查▅正常□异集群日志常存储环境状▅正常□异态常存储检查系统故障报▅正常□异告常:..短信平台维护服务应用系统在运行期间,公司需要有专人职守,定期检测,:通过对短信平台(de)维护,分析用户(de)不断更新(de)需求,分析应用系统对服务平台性能(de)要求,提出系统优化扩容解决方案,保障应用系统(de):短信数据维护;短信数据备份;日常维护;软件更新服务;对短信平台健康状态检查与分析报告;对系统用户信息进行维护和修改,添加系统用户、更改系统用户信息、权限,负责系统中管理人员、操作人员、监督人员名单(de)调整,(1)从运行值班人员及时了解应用系统(de)运行状况,配合日常运行监测,处理突发事件,组织编写事故报告、查明事故原因.(2)对应用系统出现(de)故障进行及时处理;对用户使用过程中存在(de)技术问题提出可行(de)解决方案.(3)研究制定系统(de)应急预案,并安排相关人员定期演练;:..4)负责编写规划、计划系统运行情况(de)总结;(5)建立联络机制,做好和系统实施单位以及原厂商(de)沟通;(6)对应用系统运行中出现(de)问题及时与系统实施单位和原厂商联系支持解决,以保持系统(de)(1)日常运维服务针对招标公司(de)工作日制度,为客户提供系统级(de)日常维护、定期巡检、性能测试、:,维护团队需要指派3名资深服务技术服务工程师长期值守在现场,负责对现场设备运行状态进行监视、管理和维护以及工作终端(de)管理和维护,通过对系统运行日志(de)分析提前发现并排除可能发生(de)潜在故障,并在全部维护服务团队支持下,在1小时内排除普通故障,2小时内排除较大故障,4小时内排除重大故障,,同时,提供7×24小时故障响应服务具体包括:维护期内提供、传真、电子邮件等方式(de),15分钟内响应,当现场维护工程师或节假日值班维护工程师无法排除故障时,1小时内中心派专业工程师赶赴现场进行故障诊断及处理,在1小时内排除普通故障,2小时内排除较大故障,4小时:..,,正常工作日内响应.(2)其他时间及夜间服务当系统在非工作日出现异常时,维护团队现场人员将在1小时内赶赴现场并排除系统普通故障,:通过维护团队提供(de)7×24小时响应服务热线;现场维护人员通过移动通信网络(当运维管理系统具备短信故障报警通知功能时)接收到系统报警信息;或维护人员接到服务请求时.(3)临时保障服务当遇到重大活动需要提供临时保障服务时,维护团队须在需要保障服务(de)前三天进驻现场,并对所有设备进行临时性安全检查,排除安全隐患,以做到万无一失.(4)月度检查每月对各系统及设备进行检查,进行安全系统、防病毒系统检查,进行***,并对检查中存在(de)(de)月度巡检报告,报请用户单位审批签署.(5)季度检查每季度对由维护团队(de)专业维护队伍对所有设备进行安全评估和风险分析,提交完整(de)安全状况评估报告,分析存在(de)安全漏洞情况,提出整改方案和建议.(6)年度检查每年由维护团队组织相关(de)专家(含硬件和软件)对整个系统进行安全检查,对每个硬件设备使用状态进行风险评估,并对下一年可能存在(de):..,对每个设备(de)(de)技术支持力量,拥有稳定(de)专业化(de)技术支持服务队伍,完善(de)(de)监控、简单故障(de)解决,、楼层设备、(de)处理,定期对运行情况进行分析,(1)日常服务响应时间由于针对本项目采用(de)驻留现场服务方式,维护团队需指派驻3名资深工程师采取同步(de)作息时间,因此,现场服务(de)响应时间为及时响应.(2)事故分级响应服务时间各级故障事件(de)最晚响应时间为:二级故障事三级故障事四级故障事确认时间一级故障事件件件件1小时技术服务人员4小时专业工程师技术服务人员:..小时技术支持专家专业工程师技术服务人员48小时服务项目经理服务项目经专业工程师技术服务人理员故障事件等级划分如下:一级故障事件:现有(de)网络或系统停机,或遭到严重攻击行为或安全事件,对信息系统(de)业务运作有重大影响;二级故障事件:现有网络或系统(de)操作性能严重降级,或由于网络性能失常或安全事件严重影响信息系统用户业务运作;三级故障事件:网络或系统(de)操作性能受损,安全事件(例如病毒在小范围内发作),但大部分业务运作仍可正常工作;四级故障事件:在网络、服务器、存储、安全设备功能、(de)业务运作几乎无影响,(de)原则,每一级事故严格定义升级时间为2小时,其中在二级事故和一级事故应急处理过程中,要及时考虑替代恢复方案,尽可能在最短(de)(de)处理,驻场服务人员在事故响应1个小时内,如果不能快速判断问题所在,可以寻求整个服务团队(de)、二级事故判断中,服务人员在监控中发现问题,一方面应迅速将问题向部门领导进行反应,一方面须快速判断问题和收集事故信息,涉及到具体产品提供商或服务商内,(de)正常运行,除对突发故障(de)应急支持外,要充分保障日常对业务系统软硬件(de)应急灾备恢复预案,并通过定期(de)演练加强应对突发事故(de)意识和流程.:..服务报告维护团队定期提供服务报告,服务期结束前应提供服务年报,并对每一次重大故障和问题(de)原因、解决方法、完成情况等形成专门报告,(de)记录和报告:日常维护报告系统巡检日志系统维护记录系统优化记录各类优化(de)管理制度故障分析处理记录故障整改方案和建议交接班登记表重大故障记录报告运维保障资源库建设在运维工作开展前期,把有助于用户运维(de)相关资料进行收集整理,以确保在实际运维过程中不会由于缺少沟通或者遗漏部分环节导致(de)问题处理延迟,具体保障资源如下:主机设备相关资料收集:整理各设备相关管理人员、设备物理位置等,书面文档与电子文档相结合,以确保出现设备故障或需要远程支持时能在第一时间联系到具体负责人,及早完成设备故障处理工作.:..整理设备有关(de)操作文档,并整理成册,书面文档与电子文档相结合,:整理所有设备原始配置资料,整理入库,且在修改设备配置后及时对录入(de)数据进行更新,以确保设备配置(de)(de)建立和维护:收集维护过程中出现(de)各类资料,进行分类整理入库,(de)资深管理人员负责本项目(de)项目管理,统筹相关工作,项目监督与情况汇报,控制工作质量和预算,执行变更和应急情况管理,并根据实际状况调整服务方人员安排,以保证此项目(de),并对所提供(de)服务质量和标准做出明确可量化(de)(de)服务技能培训,并对相关技术问题进行充分交流,以提高用户技术水平,,并提供对部分用户简单故障排除方法培训.:..云平台及网络环境搭建平台服务器云服务器配置清单CP内数据数应用说明操作系统网络说明U存盘量应用服务器8H16GCentOS64位200G20M1续期1应用服务器8H16GCentOS64位200G20M1续期2应用服务器8H48GCentOS64位300G01续期3应用服务器8H16GCentOS64位200G20M1新增4应用服务器8H16GCentOS64位200G01新增5应用服务器8H16GCentOS64位200G20M1新增6企业应用防火墙1新增保底带宽10Gbps1新增主机安全检测与防御HIDS1新增

软件平台运维技术方案总体方案 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数18
  • 收藏数0 收藏
  • 顶次数0
  • 上传人青山代下
  • 文件大小1.50 MB
  • 时间2024-04-13
最近更新