跳转到内容

7.3 运行维护知识串联与核心考点解析

本章内容可以按照”是什么→有什么能力→做什么事→怎么应急”的逻辑串联:

7.1 运行维护概述(是什么)
7.2 运行维护服务能力(有什么能力)
运维服务交付内容(做什么事)
运行维护应急管理(怎么应急)

1. 运维发展历程:NSM → ITSM → BSM

Section titled “1. 运维发展历程:NSM → ITSM → BSM”
发展阶段英文全称关注重点管理视角记忆口诀
NSMNetwork Systems Management(网络系统管理)只关注网络设备管理技术导向设备管理
ITSMIT Service Management(IT服务管理)以用户为核心,以流程为导向服务导向流程服务
BSMBusiness Service Management(业务服务管理)从业务角度管理IT服务业务导向业务支撑

重要考点

  • 我国大多数业主单位及运维服务团队的管理层次仍停留在ITSM初级阶段或者NSM阶段
  • ITSM的特点:以最终用户为核心,以流程为导向,追求高质量、低成本、高效

2. 运维能力模型:人员、技术、过程、资源

Section titled “2. 运维能力模型:人员、技术、过程、资源”

这是按照ITSS体系要求建立的四维度评价模型,每个维度都很重要:

(1) 人员维度——“人事管理六要素”

要素说明举例
组织架构成立运维保障部门领导小组、调度组、技术组、专家组
岗位职责设置管理岗、技术岗、操作岗明确每个人做什么
人员储备建立人员储备计划和机制备份人员、梯队建设
人员培训识别培训要求,提供有效培训新技术培训、技能提升
绩效考核明确奖惩规则绩效评分、奖惩制度

记忆口诀:架构岗储备,培训加考核(“架岗储培考”)

(2) 技术维度——“研发应用促发展”

技术维度关注的是运维服务的技术创新能力,包括:

  • 运维服务能力长期发展的需求调研与分析
  • 技术管理
  • 实现预期目标
  • 成果应用,创造服务价值

(3) 过程维度——“七项管理缺一不可”

过程维度是ITSM的核心,包含了七项关键管理流程:

管理类型核心问题记忆口诀
服务级别管理提供什么服务?
服务报告服务情况如何?
事件管理发现问题
问题管理解决问题
配置管理资源配置?
变更管理如何变更?
发布管理如何发布?
信息安全管理安全如何保障?

记忆口诀:事问配变发安级报(按首字记忆)

(4) 资源维度——“四大支撑保运行”

资源类型作用记忆要点
运维工具过程管理、监控、专用处理工具支撑
备品备件设备故障时更换备用物资
服务台用户沟通枢纽交流渠道
知识库经验积累共享知识沉淀

记忆口诀:工具备件服务台,知识库房保运行

1. 运维服务需求识别:四大类型

Section titled “1. 运维服务需求识别:四大类型”
服务类型性质触发方式主要内容
例行操作服务主动/常态按计划执行监控、预防性检查、常规作业
响应支持服务被动/应急事件触发应用/系统启停、故障处理、权限配置
优化改善服务主动/提升定期或按需参数优化、功能升级、性能优化
调研评估服务主动/规划项目需求需求评估、方案制定、变更评估

记忆口诀:做(例行操作)→ 修(响应支持)→ 改(优化改善)→ 评(调研评估)

2. 例行操作 vs 响应支持 vs 优化改善 详细对比

Section titled “2. 例行操作 vs 响应支持 vs 优化改善 详细对比”
对比项例行操作响应支持优化改善
性质常态工作应急处理主动提升
触发按计划/定时事件/故障发生定期/按需
目的预防问题解决问题提升性能
典型工作日常巡检、定期备份故障处理、系统启停参数调优、版本升级

举例理解

  • 例行操作:就像汽车定期保养(5000公里换机油)
  • 响应支持:就像汽车坏了叫拖车修车(发动机故障维修)
  • 优化改善:就像给汽车升级导航、加装行车记录仪(让车更好用)
交付方式适用场景优点缺点
现场交付复杂问题、硬件维护处理彻底成本高、响应慢
远程交付软件问题、常规维护成本低、响应快无法处理硬件问题
原则含义举例
统一领导应急响应由一个领导机构统一指挥应急指挥中心统一调度
分级负责按事件级别由不同层级负责小事件由值班人员,大事件由领导
预防为主重视预防工作,减少事件发生定期检查、风险评估
快速响应事件发生后快速启动响应第一时间处置

记忆口诀:统分预防快

步骤一:建立应急管理制度
↓ 明确目标、原则、范围、管理制度
步骤二:规范应急响应组织
↓ 业主单位 + 服务商 + 执行单位
步骤三:制定应急响应预案
↓ 风险评估 → 形成报告 → 应对措施 → 应急演练
步骤四:组织培训并开展应急演练
↓ 制定计划 → 培训人员 → 演练记录 → 形成报告
步骤五:应急响应工作总结
↓ 定期分析回顾 → 总结经验

SLA(服务级别协议) 是运维服务的”契约”,规定了:

  • 服务内容
  • 服务指标(如响应时间、可用性等)

运维服务交付 是SLA的具体执行,包括:

  • 例行操作
  • 响应支持
  • 优化改善
  • 调研评估

关系图

SLA(约定做什么)
运维服务交付(实际做什么)
├── 例行操作
├── 响应支持
├── 优化改善
└── 调研评估
序号考点答案出题频率
1ITSM的核心特点以用户为核心,以流程为导向⭐⭐⭐⭐
2BSM的核心特点以业务支撑为核心⭐⭐⭐
3运维能力四维度人员、技术、过程、资源⭐⭐⭐⭐⭐
4运维服务四类型例行操作、响应支持、优化改善、调研评估⭐⭐⭐⭐⭐
5过程管理七项事件、问题、配置、变更、发布、安全、级别⭐⭐⭐
6应急管理四原则统一领导、分级负责、预防为主、快速响应⭐⭐⭐⭐
7我国运维现状ITSM初级阶段或NSM阶段⭐⭐⭐
8SLA的定义业主与服务商之间的服务契约文件⭐⭐⭐
9运维工具分类过程管理工具、监控工具、专用工具⭐⭐
10服务台的作用用户与服务人员的交流枢纽⭐⭐
概念关注对象管理视角发展阶段
NSM网络设备技术导向第一阶段
ITSMIT服务流程服务导向第二阶段
BSM业务服务业务导向第三阶段
概念定义目的例子
事件管理发生意外或服务中断尽快恢复服务服务器宕机,快速重启
问题管理找出事件根本原因防止再次发生分析为什么服务器总宕机

记忆口诀:事件求快(快速恢复),问题求根(根因分析)

概念性质目的频率
例行操作预防性工作防止问题发生定期/定时
优化改善提升性工作提升系统性能按需/定期
概念适用场景成本响应速度
现场交付硬件问题、复杂故障
远程交付软件问题、常规维护
知识点记忆口诀
运维发展阶段网流业(NSM→ITSM→BSM)
能力四维度人技过资
人员六要素架岗储培考(架构+岗位+储备+培训+考核)
过程七管理事问配变发安级
服务四类型做修改评
应急四原则统分预防快
运维工具三类过监专(过程+监控+专用)
资源四类型工具备件服务台,知识库房保运行
  1. 理解为主,记忆为辅:先理解每个概念的含义,再通过口诀辅助记忆
  2. 对比学习:将相似概念放在一起对比,找出区别
  3. 联系实际:把运维知识与实际工作生活联系起来,如汽车4S店比喻
  4. 做题巩固:通过练习题检验理解程度,特别是易混淆概念
  5. 画图串联:自己画思维导图,将知识点串联起来

十、本章综合测验(真题难度)

Section titled “十、本章综合测验(真题难度)”
练习

某运维团队在处理一个严重的数据库性能问题时,首先通过重启服务恢复了业务(事件管理),随后成立了专项小组,利用根因分析法找到了索引失效的根本原因,并制定了长期的优化方案(问题管理)。在实施该优化方案前,团队提交了申请并经过了严格的技术评审和风险评估。这一申请评审过程属于( )

  • A A. 质量控制
  • B B. 变更管理 (Change Management)
  • C C. 发布管理
  • D D. 配置管理
练习

关于运维服务能力的评价,按照ITSS模型,如果一个运维团队拥有完善的监控工具、充足的备品备件、响应及时的服务台以及内容丰富的知识库,但缺乏明确的服务级别管理流程和事件处理机制,则该团队在能力维度上属于( )强,( )弱。

  • A A. 资源;人员
  • B B. 资源;过程
  • C C. 技术;资源
  • D D. 技术;过程

本章总结:运行维护章节核心是”一个模型(能力四维度)、两个协议(SLA、服务交付)、三个阶段(NSM→ITSM→BSM)、四个服务(例行操作、响应支持、优化改善、调研评估)”

💬 讨论区