跳转到内容

第7章 运行维护

掌握信息系统运行维护的概念、内容、流程以及ITIL/ITSM框架。

信息系统运行维护是指在信息系统投入使用后,为保证系统正常、高效运行,对系统进行的监控、管理、维护和改进等活动。

重点 ★★★★☆

运维四大目标

稳定性、可用性、性能、安全性


运维八大内容

  1. 日常监控:系统运行状态监控
  2. 故障处理:及时响应和处理故障
  3. 性能优化:提升系统性能
  4. 备份恢复:数据备份和灾难恢复
  5. 安全管理:安全策略和防护
  6. 配置管理:配置变更管理
  7. 容量管理:资源规划和扩容
  8. 文档管理:运维文档维护
公式 ★★★★★

三大备份策略

完全备份、增量备份、差异备份

备份方式说明优点缺点
完全备份备份所有数据恢复快速时间长、空间大
增量备份备份上次备份后的变化速度快、空间小恢复复杂
差异备份备份上次完全备份后的变化恢复较快占用空间逐渐增大

IT基础架构库(IT Infrastructure Library)是关于IT服务管理的最佳实践框架。

公式 ★★★★★

ITIL v3五阶段

战略→设计→转换→运营→持续改进

阶段说明
服务战略定义IT服务战略
服务设计设计IT服务解决方案
服务转换构建和部署IT服务
服务运营提供和支持IT服务
持续服务改进不断改进服务质量

服务运营五大流程

  1. 事件管理:快速恢复正常服务
  2. 问题管理:找出根本原因,防止再发
  3. 变更管理:控制变更风险
  4. 配置管理:维护配置项数据库(CMDB)
  5. 发布管理:控制发布和部署

基于ITIL的IT服务管理实践,强调以客户为中心提供IT服务。

重点 ★★★★☆

运维KPI指标

可用性、响应时间、故障率、恢复时间

指标说明计算公式
可用性系统正常运行时间占比(总时间-故障时间)/总时间×100%
MTBF平均无故障时间总运行时间/故障次数
MTTR平均修复时间总修复时间/故障次数
SLA服务水平协议服务质量承诺
指标说明
RPO恢复点目标,允许丢失的数据量
RTO恢复时间目标,允许的中断时间

DevOps是开发(Development)和运维(Operations)的组合,强调开发与运维的协作和自动化。

DevOps关键实践

  • 持续集成(CI):频繁合并代码
  • 持续交付(CD):自动化部署
  • 基础设施即代码(IaC):代码化管理基础设施
  • 监控和日志:实时监控系统状态
  • 微服务架构:服务解耦

练习

某数据中心在每周日凌晨2点进行一次完全备份,周一至周六凌晨2点进行差异备份。如果周四上午10点数据库发生故障导致数据丢失,恢复数据时需要用到( )

  • A A. 仅周日的完全备份
  • B B. 周日的完全备份 + 周一、周二、周三的差异备份
  • C C. 周日的完全备份 + 周三的差异备份
  • D D. 周日的完全备份 + 周三的差异备份 + 周四的日志
练习

某系统平均运行1000小时才发生一次故障,故障后平均需要2小时修复。该系统的可用性(Availability)计算式是( )

  • A A. 1000 / (1000 + 2)
  • B B. 1000 / 2
  • C C. (1000 - 2) / 1000
  • D D. 2 / 1000
练习

运维团队接到用户报告:'网页访问速度非常慢'。运维人员查看监控发现Web服务器CPU利用率达到99%。根据ITIL服务运营流程,处理此事的正确顺序是( )

  • A A. 立即重启服务器(事件管理) -> 分析日志找原因(问题管理)
  • B B. 先分析日志找根本原因,找到了再处理,以免破坏现场
  • C C. 提交变更申请,升级服务器CPU配置
  • D D. 忽略,等待CPU自动降下来
  1. 运维目标:稳定性、可用性、性能、安全性
  2. 备份策略:完全备份、增量备份、差异备份
  3. ITIL v3五阶段:战略→设计→转换→运营→持续改进
  4. 服务运营五流程:事件、问题、变更、配置、发布管理
  5. 运维KPI:可用性、MTBF、MTTR、SLA
  6. 灾难恢复:RPO(恢复点目标)、RTO(恢复时间目标)
  7. DevOps实践:CI/CD、IaC、监控、微服务
💬 讨论区