7.3 运行维护知识串联与核心考点解析
一、本章整体逻辑框架
Section titled “一、本章整体逻辑框架”本章内容可以按照”是什么→有什么能力→做什么事→怎么应急”的逻辑串联:
7.1 运行维护概述(是什么) ↓7.2 运行维护服务能力(有什么能力) ↓运维服务交付内容(做什么事) ↓运行维护应急管理(怎么应急)二、核心知识串联
Section titled “二、核心知识串联”1. 运维发展历程:NSM → ITSM → BSM
Section titled “1. 运维发展历程:NSM → ITSM → BSM”| 发展阶段 | 英文全称 | 关注重点 | 管理视角 | 记忆口诀 |
|---|---|---|---|---|
| NSM | Network Systems Management(网络系统管理) | 只关注网络设备管理 | 技术导向 | 设备管理 |
| ITSM | IT Service Management(IT服务管理) | 以用户为核心,以流程为导向 | 服务导向 | 流程服务 |
| BSM | Business Service Management(业务服务管理) | 从业务角度管理IT服务 | 业务导向 | 业务支撑 |
重要考点:
- 我国大多数业主单位及运维服务团队的管理层次仍停留在ITSM初级阶段或者NSM阶段
- ITSM的特点:以最终用户为核心,以流程为导向,追求高质量、低成本、高效
2. 运维能力模型:人员、技术、过程、资源
Section titled “2. 运维能力模型:人员、技术、过程、资源”这是按照ITSS体系要求建立的四维度评价模型,每个维度都很重要:
(1) 人员维度——“人事管理六要素”
| 要素 | 说明 | 举例 |
|---|---|---|
| 组织架构 | 成立运维保障部门 | 领导小组、调度组、技术组、专家组 |
| 岗位职责 | 设置管理岗、技术岗、操作岗 | 明确每个人做什么 |
| 人员储备 | 建立人员储备计划和机制 | 备份人员、梯队建设 |
| 人员培训 | 识别培训要求,提供有效培训 | 新技术培训、技能提升 |
| 绩效考核 | 明确奖惩规则 | 绩效评分、奖惩制度 |
记忆口诀:架构岗储备,培训加考核(“架岗储培考”)
(2) 技术维度——“研发应用促发展”
技术维度关注的是运维服务的技术创新能力,包括:
- 运维服务能力长期发展的需求调研与分析
- 技术管理
- 实现预期目标
- 成果应用,创造服务价值
(3) 过程维度——“七项管理缺一不可”
过程维度是ITSM的核心,包含了七项关键管理流程:
| 管理类型 | 核心问题 | 记忆口诀 |
|---|---|---|
| 服务级别管理 | 提供什么服务? | 级 |
| 服务报告 | 服务情况如何? | 报 |
| 事件管理 | 发现问题 | 事 |
| 问题管理 | 解决问题 | 问 |
| 配置管理 | 资源配置? | 配 |
| 变更管理 | 如何变更? | 变 |
| 发布管理 | 如何发布? | 发 |
| 信息安全管理 | 安全如何保障? | 安 |
记忆口诀:事问配变发安级报(按首字记忆)
(4) 资源维度——“四大支撑保运行”
| 资源类型 | 作用 | 记忆要点 |
|---|---|---|
| 运维工具 | 过程管理、监控、专用处理 | 工具支撑 |
| 备品备件 | 设备故障时更换 | 备用物资 |
| 服务台 | 用户沟通枢纽 | 交流渠道 |
| 知识库 | 经验积累共享 | 知识沉淀 |
记忆口诀:工具备件服务台,知识库房保运行
三、运维服务内容详解
Section titled “三、运维服务内容详解”1. 运维服务需求识别:四大类型
Section titled “1. 运维服务需求识别:四大类型”| 服务类型 | 性质 | 触发方式 | 主要内容 |
|---|---|---|---|
| 例行操作服务 | 主动/常态 | 按计划执行 | 监控、预防性检查、常规作业 |
| 响应支持服务 | 被动/应急 | 事件触发 | 应用/系统启停、故障处理、权限配置 |
| 优化改善服务 | 主动/提升 | 定期或按需 | 参数优化、功能升级、性能优化 |
| 调研评估服务 | 主动/规划 | 项目需求 | 需求评估、方案制定、变更评估 |
记忆口诀:做(例行操作)→ 修(响应支持)→ 改(优化改善)→ 评(调研评估)
2. 例行操作 vs 响应支持 vs 优化改善 详细对比
Section titled “2. 例行操作 vs 响应支持 vs 优化改善 详细对比”| 对比项 | 例行操作 | 响应支持 | 优化改善 |
|---|---|---|---|
| 性质 | 常态工作 | 应急处理 | 主动提升 |
| 触发 | 按计划/定时 | 事件/故障发生 | 定期/按需 |
| 目的 | 预防问题 | 解决问题 | 提升性能 |
| 典型工作 | 日常巡检、定期备份 | 故障处理、系统启停 | 参数调优、版本升级 |
举例理解:
- 例行操作:就像汽车定期保养(5000公里换机油)
- 响应支持:就像汽车坏了叫拖车修车(发动机故障维修)
- 优化改善:就像给汽车升级导航、加装行车记录仪(让车更好用)
3. 运维服务交付方式
Section titled “3. 运维服务交付方式”| 交付方式 | 适用场景 | 优点 | 缺点 |
|---|---|---|---|
| 现场交付 | 复杂问题、硬件维护 | 处理彻底 | 成本高、响应慢 |
| 远程交付 | 软件问题、常规维护 | 成本低、响应快 | 无法处理硬件问题 |
四、应急管理完整流程
Section titled “四、应急管理完整流程”1. 应急管理四原则
Section titled “1. 应急管理四原则”| 原则 | 含义 | 举例 |
|---|---|---|
| 统一领导 | 应急响应由一个领导机构统一指挥 | 应急指挥中心统一调度 |
| 分级负责 | 按事件级别由不同层级负责 | 小事件由值班人员,大事件由领导 |
| 预防为主 | 重视预防工作,减少事件发生 | 定期检查、风险评估 |
| 快速响应 | 事件发生后快速启动响应 | 第一时间处置 |
记忆口诀:统分预防快
2. 应急管理实施步骤
Section titled “2. 应急管理实施步骤”步骤一:建立应急管理制度 ↓ 明确目标、原则、范围、管理制度步骤二:规范应急响应组织 ↓ 业主单位 + 服务商 + 执行单位步骤三:制定应急响应预案 ↓ 风险评估 → 形成报告 → 应对措施 → 应急演练步骤四:组织培训并开展应急演练 ↓ 制定计划 → 培训人员 → 演练记录 → 形成报告步骤五:应急响应工作总结 ↓ 定期分析回顾 → 总结经验五、SLA与服务交付的关系
Section titled “五、SLA与服务交付的关系”SLA(服务级别协议) 是运维服务的”契约”,规定了:
- 服务内容
- 服务指标(如响应时间、可用性等)
运维服务交付 是SLA的具体执行,包括:
- 例行操作
- 响应支持
- 优化改善
- 调研评估
关系图:
SLA(约定做什么) ↓运维服务交付(实际做什么) ├── 例行操作 ├── 响应支持 ├── 优化改善 └── 调研评估六、核心考点速查表
Section titled “六、核心考点速查表”| 序号 | 考点 | 答案 | 出题频率 |
|---|---|---|---|
| 1 | ITSM的核心特点 | 以用户为核心,以流程为导向 | ⭐⭐⭐⭐ |
| 2 | BSM的核心特点 | 以业务支撑为核心 | ⭐⭐⭐ |
| 3 | 运维能力四维度 | 人员、技术、过程、资源 | ⭐⭐⭐⭐⭐ |
| 4 | 运维服务四类型 | 例行操作、响应支持、优化改善、调研评估 | ⭐⭐⭐⭐⭐ |
| 5 | 过程管理七项 | 事件、问题、配置、变更、发布、安全、级别 | ⭐⭐⭐ |
| 6 | 应急管理四原则 | 统一领导、分级负责、预防为主、快速响应 | ⭐⭐⭐⭐ |
| 7 | 我国运维现状 | ITSM初级阶段或NSM阶段 | ⭐⭐⭐ |
| 8 | SLA的定义 | 业主与服务商之间的服务契约文件 | ⭐⭐⭐ |
| 9 | 运维工具分类 | 过程管理工具、监控工具、专用工具 | ⭐⭐ |
| 10 | 服务台的作用 | 用户与服务人员的交流枢纽 | ⭐⭐ |
七、易混淆概念辨析
Section titled “七、易混淆概念辨析”1. NSM vs ITSM vs BSM
Section titled “1. NSM vs ITSM vs BSM”| 概念 | 关注对象 | 管理视角 | 发展阶段 |
|---|---|---|---|
| NSM | 网络设备 | 技术导向 | 第一阶段 |
| ITSM | IT服务流程 | 服务导向 | 第二阶段 |
| BSM | 业务服务 | 业务导向 | 第三阶段 |
2. 事件管理 vs 问题管理
Section titled “2. 事件管理 vs 问题管理”| 概念 | 定义 | 目的 | 例子 |
|---|---|---|---|
| 事件管理 | 发生意外或服务中断 | 尽快恢复服务 | 服务器宕机,快速重启 |
| 问题管理 | 找出事件根本原因 | 防止再次发生 | 分析为什么服务器总宕机 |
记忆口诀:事件求快(快速恢复),问题求根(根因分析)
3. 例行操作 vs 优化改善
Section titled “3. 例行操作 vs 优化改善”| 概念 | 性质 | 目的 | 频率 |
|---|---|---|---|
| 例行操作 | 预防性工作 | 防止问题发生 | 定期/定时 |
| 优化改善 | 提升性工作 | 提升系统性能 | 按需/定期 |
4. 现场交付 vs 远程交付
Section titled “4. 现场交付 vs 远程交付”| 概念 | 适用场景 | 成本 | 响应速度 |
|---|---|---|---|
| 现场交付 | 硬件问题、复杂故障 | 高 | 慢 |
| 远程交付 | 软件问题、常规维护 | 低 | 快 |
八、记忆口诀汇总
Section titled “八、记忆口诀汇总”| 知识点 | 记忆口诀 |
|---|---|
| 运维发展阶段 | 网流业(NSM→ITSM→BSM) |
| 能力四维度 | 人技过资 |
| 人员六要素 | 架岗储培考(架构+岗位+储备+培训+考核) |
| 过程七管理 | 事问配变发安级 |
| 服务四类型 | 做修改评 |
| 应急四原则 | 统分预防快 |
| 运维工具三类 | 过监专(过程+监控+专用) |
| 资源四类型 | 工具备件服务台,知识库房保运行 |
九、学习建议
Section titled “九、学习建议”- 理解为主,记忆为辅:先理解每个概念的含义,再通过口诀辅助记忆
- 对比学习:将相似概念放在一起对比,找出区别
- 联系实际:把运维知识与实际工作生活联系起来,如汽车4S店比喻
- 做题巩固:通过练习题检验理解程度,特别是易混淆概念
- 画图串联:自己画思维导图,将知识点串联起来
十、本章综合测验(真题难度)
Section titled “十、本章综合测验(真题难度)” 练习
某运维团队在处理一个严重的数据库性能问题时,首先通过重启服务恢复了业务(事件管理),随后成立了专项小组,利用根因分析法找到了索引失效的根本原因,并制定了长期的优化方案(问题管理)。在实施该优化方案前,团队提交了申请并经过了严格的技术评审和风险评估。这一申请评审过程属于( )
练习
关于运维服务能力的评价,按照ITSS模型,如果一个运维团队拥有完善的监控工具、充足的备品备件、响应及时的服务台以及内容丰富的知识库,但缺乏明确的服务级别管理流程和事件处理机制,则该团队在能力维度上属于( )强,( )弱。
本章总结:运行维护章节核心是”一个模型(能力四维度)、两个协议(SLA、服务交付)、三个阶段(NSM→ITSM→BSM)、四个服务(例行操作、响应支持、优化改善、调研评估)”