跳转到内容

7.2 运行维护服务能力

掌握运行维护服务能力模型的四维度(人员、技术、过程、资源)、服务内容、交付过程和应急管理。

按照ITSS体系要求:从人员、技术、过程、资源四个维度评价运维服务团队的能力

公式 ★★★★★

运维能力四维度

人员 + 技术 + 过程 + 资源

(1) 人员维度

内容说明
组织架构成立运维保障部门,包括运维保障领导小组、运维保障调度组、运维保障技术组、运维保障专家组等
岗位职责运维服务提供方的运维团队岗位设置一般包括管理岗、技术岗、操作岗等岗位
人员储备建立起与运维服务相关的人员储备计划和机制
人员培训根据运维服务需求,建立运行维护服务培训计划,识别培训要求,并提供及时和有效的培训
绩效考核建立与运维服务相关的绩效考核体系或机制,并明确奖惩规则

(2) 技术维度

技术研发和成果应用

  • 运维服务能力长期发展的需求调研与分析
  • 技术管理
  • 预期目标
  • 实现服务价值

(3) 过程维度

运维服务管理

  • 服务级别管理:运维服务目录、运维服务对象、运维服务内容
  • 服务报告
  • 事件管理:发现问题
  • 问题管理:解决问题
  • 配置管理
  • 变更管理
  • 发布管理
  • 信息安全管理

(4) 资源维度

资源类型说明
运维工具运行维护工具可分为过程管理工具、监控工具和专用工具
备品备件建立备件库,保证设备或系统的正常运行;包括制定备件库管理规范、制订备件采购计划、制定出入库制度、制定备件的检测、报废制度
服务台负责在各时间段,提供给用户或服务人员利用电话、邮箱、即时通信、网络或其他自动化手段,针对发生的事件、用户请求、变更等进行交流的途径
知识库运维服务团队应对运行维护工作相关的经验进行积累,形成可在运维团队内共享、可重复使用的知识和信息

包括:运维服务需求识别、运维服务交付内容、运维服务交付方式

(1) 运维服务需求识别

四类服务

  1. 例行操作服务
  2. 响应支持服务
  3. 优化改善服务
  4. 调研评估服务

(2) 运维服务交付内容

交付内容说明
调研评估需求的调研、评估和服务方案的制定;系统版本管理方案的制定;需求变更方案的制定与评估;软件升级方案的制定与评估;系统优化方案的制定与评估;重大配置变更评估和方案的制定;系统迁移需求的调研、评估和方案的制定
例行操作按照约定的触发条件或预先规定的常态服务,运维服务提供方对信息系统的例行操作一般分为监控、预防性检查和常规作业
响应支持运维服务提供方对信息系统的响应支持工作一般包括:应用级启停、系统级启停、用户注册、权限配置、更新驱动、用户口令重置、参数调整、系统配置、故障处理
优化改善对操作系统、数据库、应用服务器中间件等的集成性优化;优化系统参数、配置文件,更新系统错误或性能更新包;对现有系统进行功能更新,应用系统升级;对客户端错误或已知漏洞进行修复;对性能和可靠性进行优化改善;对业务逻辑、符合度的优化改善;对应用服务能力进行优化;对应用日志级别及日志空间的调整

(3) 运维服务交付方式

两种方式

  • 现场交付:运维人员到现场进行维护
  • 远程交付:通过远程方式(如VPN、远程桌面)进行维护

建立应急管理制度: 业主单位负责制定应急响应制度,明确应急响应的目标、原则、范围及各项管理制度。应急管理制度要遵循统一领导、分级负责、预防为主、快速响应的原则。

规范应急响应组织: 应急管理组织架构由运维项目相关单位组成,包括业主单位的信息化主管部门、信息系统的运维服务提供方、运维服务执行单位等。

制定应急响应预案: 对风险要素进行评估,形成风险评估报告,形成应对措施,开展应急演练。

组织培训并开展应急演练

  1. 制订应急演练计划、演练脚本
  2. 对应急组织人员进行培训,讲解应急演练预案、应急演练计划和脚本
  3. 对应急演练的整个过程进行详细记录,并形成报告
  4. 要保证应急演练的过程不影响业务的正常运行

应急响应工作总结: 运维服务团队定期对发生的应急事件和应急响应工作进行分析与回顾,并总结经验。

人员维度例子

就像一个医院的运维团队:

  • 领导小组:院长(统一指挥)
  • 调度组:护士长(协调调度)
  • 技术组:各科室医生(专业技术)
  • 专家组:老教授(疑难问题)

运维工具例子

就像修车工具箱:

  • 过程管理工具:修车流程手册
  • 监控工具:血压计、心电图仪(监控系统状态)
  • 专用工具:扳手、螺丝刀(专用设备)

服务台例子

就像医院的挂号台或客服中心,用户有问题先到这里登记,然后分配给相应的技术人员处理。

知识库例子

就像医院的病例库,积累了各种病症的治疗经验,以后遇到类似问题可以快速找到解决方案。

应急管理例子

就像消防演练:

  • 制定消防预案(应急响应预案)
  • 培训员工使用灭火器(组织培训)
  • 定期进行演练(开展应急演练)
  • 总结演练经验(工作总结)

响应支持 vs 优化改善例子

就像汽车保养:

  • 响应支持:车坏了叫拖车(故障处理)、车钥匙丢了去配钥匙(口令重置)、发现车有异响去检查(更新驱动) - 被动应急,立即解决当前问题
  • 优化改善:定期换机油(参数优化)、升级导航系统(功能升级)、加装行车记录仪(性能优化) - 主动提升,让车更好用
维度/类型关键内容记忆要点
能力模型四维度人员、技术、过程、资源四维模型
人员五要素正确选人、组织架构、岗位职责、人员储备、人员培训、绩效考核人事管理
过程管理服务级别、事件、问题、配置、变更、发布、信息安全管理七项管理
资源四类型运维工具、备品备件、服务台、知识库资源支撑
服务需求四类型例行操作、响应支持、优化改善、调研评估服务分类
响应支持应用/系统启停、用户注册、权限配置、更新驱动、口令重置、故障处理问题驱动
优化改善参数优化、功能升级、漏洞修复、性能优化、日志调整主动提升
交付方式两类型现场交付、远程交付交付方式
应急管理四原则统一领导、分级负责、预防为主、快速响应应急准则
服务台作用用户与服务人员的交流枢纽,记录管理事件和请求沟通枢纽
知识库作用积累经验,团队共享,可重复使用经验共享
备品备件管理采购计划、出入库制度、检测报废制度备件管理
练习

根据ITSS(信息技术服务标准),运维服务能力模型包含四个维度。某运维方为了提高工作效率,自主开发了一套自动化巡检脚本,并将其集成到了现有的监控平台中。这一动作主要提升了运维能力的( )维度。

  • A A. 人员 (Personnel)
  • B B. 资源 (Resource)
  • C C. 技术 (Technology)
  • D D. 过程 (Process)
练习

运维工程师接到通知:'某核心交换机风扇异常,建议更换'。在完成备件申领和到场更换后,工程师在运维管理系统中记录了该操作并结案。这一系列活动属于运维服务交付内容中的( )

  • A A. 例行操作服务
  • B B. 响应支持服务
  • C C. 优化改善服务
  • D D. 调研评估服务
练习

在运维应急管理中,当发生大范围网络中断事故时,运维组长立即启动了《应急响应预案》,并向应急保障领导小组报告,由领导小组统一指挥各组协同作战。这主要体现了应急管理的( )原则。

  • A A. 预防为主
  • B B. 快速响应
  • C C. 统一领导
  • D D. 分级负责
练习

运维团队为了实现'经验共享、避免重复劳动',要求每位工程师在解决疑难故障后,必须将处理过程和方法整理成文档上传到共享平台。这涉及运维能力模型中的( )资源。

  • A A. 运维工具
  • B B. 服务台
  • C C. 备品备件
  • D D. 知识库
练习

以下活动中,属于'优化改善服务'的是( )

  • A A. 每日对机房温湿度进行检查记录
  • B B. 为新员工创建系统账号并分配权限
  • C C. 针对系统在高并发下的性能瓶颈,调整数据库连接池参数
  • D D. 对由于误操作删除的数据进行恢复
  1. 能力模型四维度:人员、技术、过程、资源
  2. 人员五要素:组织架构、岗位职责、人员储备、人员培训、绩效考核
  3. 过程管理七项:服务级别、事件、问题、配置、变更、发布、信息安全管理
  4. 资源四类型:运维工具、备品备件、服务台、知识库
  5. 服务需求四类型:例行操作、响应支持、优化改善、调研评估
  6. 应急管理四原则:统一领导、分级负责、预防为主、快速响应
  7. 交付方式:现场交付、远程交付
💬 讨论区