更新时间:2023-07-14 19:58
《IT服务连续性实现指南》是2016年5月1日清华大学出版社出版的图书,作者是姚强。
本书致力于解决国内数据中心在IT应急处置机制建设和管理过程中普遍遇到的、最迫切的问题,从而帮助数据中心实现“少停机、少丢数”的目标。
本书系统化地阐述IT服务连续性知识体系,它是从业务连续性知识体系衍生而出的、专门聚焦于数据中心“业务”连续性的一个独立的、具备清晰边界的知识体系。
本书提供完整的IT服务连续性活动框架,它是IT服务连续性知识体系的核心,它是促进数据中心“少停机、少丢数”的核心利器,它包括以下三部分:
1.IT应急处置活动框架,阐述了IT部门与企业其他条线在重大IT事件发生后如何完美地分工协作、协调联动。
2.IT应急处置机制开发活动框架,阐述了IT部门如何以IT服务连续性目标为导向自上而下地、系统化地建设IT应急响应机制、高可用备份机制和灾备机制。
3.IT服务连续性管理活动框架,阐述了IT部门在IT应急处置机制生命周期中需要开展的管理活动。
本书是一种系统地、全面地阐述IT服务连续性知识体系的专著,旨在为社会培养IT服务连续性领域的人才,为数据中心开展IT服务连续性活动提供详细指引,帮助数据中心实现“少停机、少丢数、少花钱”的夙愿。 本书基于大量图表,直观地阐述以下内容:IT服务连续性涉及的IT服务、业务、IT资源、IT流程、IT组织和IT事件等方面的基础概念和知识。企业各条线的IT事件应急处置行动框架与IT事件应急处置机制。以IT服务连续性目标为导向建设IT应急响应机制、高可用恢复机制和灾难恢复机制的活动框架。IT服务连续性管理活动框架,包括实现IT服务连续性所必须具备的项目管理、运维管理、IT应急处置机制就绪管理、风险管理、IT应急处置机制持续更新管理、绩效管理、内部控制和内部审计活动。
第1章IT服务剖析 1
1.1IT服务 1
1.2业务 3
1.3IT资源 6
1.3.1IT资源框架 6
1.3.2应用系统 7
1.3.3IT基础设施 10
1.3.4IT资源的属性 10
1.3.5IT资源属性与IT服务属性的映射关系 11
1.4IT流程 12
1.5IT组织 13
第2章IT事件剖析 16
2.1IT事件定义 16
2.2IT事件前因 16
2.2.1IT威胁源 17
2.2.2IT威胁源消减措施 18
2.3IT事件类别 19
2.4IT事件后果 20
2.4.1IT损害 20
2.4.2IT事件影响 21
2.5IT事件级别 23
2.6IT服务连续性的意义 24
第3章IT事件应对过程 26
3.1IT事件闭环应对过程 26
3.2IT事件防范 27
3.3IT事件监测预测 27
3.4IT事件应急处置 28
3.4.1重大IT事件应急处置案例 28
3.4.2IT事件应急处置行动框架 35
3.4.3IT事件预警与预警响应 35
3.4.4IT事件先期处置 39
3.4.5IT事件后果评估 41
3.4.6IT事件恢复决策 46
3.4.7IT事件恢复 48
3.4.8重大IT事件应急保障 52
3.5重续运行 52
第4章IT事件应急处置机制 55
4.1IT应急处置机制 55
4.1.1IT应急响应机制 56
4.1.2高可用恢复机制 58
4.1.3灾难恢复机制 61
4.2企业层面IT事件应急处置机制 68
4.3业务条线IT事件应急处置机制 71
第5章IT应急处置机制开发过程 74
5.1IT应急处置机制开发活动框架 74
5.2风险分析 75
5.3业务影响分析 77
5.3.1获取企业层面和业务条线的BIA结果 78
5.3.2IT关联性分析 78
5.3.3应用系统影响分析 79
5.3.4定义重要信息系统 80
5.3.5定义重要信息系统的启停顺序 80
5.3.6定义信息系统灾难RTO 81
5.3.7定义信息系统灾难RPO 81
5.4IT应急处置策略开发 82
5.4.1IT应急响应策略开发 83
5.4.2高可用恢复策略开发 85
5.4.3灾难恢复策略开发 86
5.5灾备中心选址 94
5.5.1确定候选城市 94
5.5.2初步筛选候选城市 94
5.5.3比对并确定异地灾备中心所在城市 95
5.5.4确定灾备中心的具体地址 96
5.6IT应急处置资源设计 97
5.6.1关键技术POC 98
5.6.2生产环境改造设计 98
5.6.3高可用备份系统设计 100
5.6.4灾备系统设计 103
5.6.5自动化灾备指挥与切换平台设计 115
5.6.6IT应急指挥中心设计 116
5.7IT应急处置资源实施 116
5.8IT应急预案开发 118
5.8.1IT总体应急预案开发 118
5.8.2IT先期处置预案开发 120
5.8.3高可用恢复手册开发 120
5.8.4灾难恢复预案开发 121
5.8.5其他条线的IT事件应急预案开发 122
5.9应急演练 123
5.9.1高可用备份系统切换演练 123
5.9.2灾备演练 124
第6章IT服务连续性管理过程 130
6.1IT服务连续性管理活动框架 130
6.2IT应急处置机制开发项目管理 131
6.2.1管理活动 132
6.2.2管理过程 137
6.2.3管理角色与职责 138
6.3IT应急处置资源运维管理 139
6.3.1管理活动 139
6.3.2管理过程 142
6.3.3管理角色与职责 143
6.4IT应急处置资源风险管理 143
6.4.1管理活动 143
6.4.2管理过程 150
6.4.3管理角色与职责 152
6.5IT应急处置机制就绪管理 152
6.5.1管理活动 153
6.5.2管理过程 156
6.5.3管理角色与职责 158
6.6IT应急处置机制持续更新管理 159
6.6.1管理活动 159
6.6.2管理过程 161
6.6.3管理角色与职责 162
6.7IT服务连续性绩效管理 162
6.7.1管理活动 163
6.7.2管理过程 170
6.7.3管理角色与职责 171
6.8IT服务连续性内部控制 172
6.8.1管理活动 172
6.8.2管理过程 175
6.8.3管理角色与职责 177
第7章IT服务连续性管理体系 178
7.1IT服务连续性管理体系框架 178
7.2IT服务连续性管理体系的边界环境 179
7.2.1企业业务连续性管理体系 180
7.2.2IT服务连续性内部审计机制 183
7.2.3IT服务连续性法规 184
7.2.4IT服务连续性SLA 185
7.2.5IT服务连续性管理规范 185
7.3IT服务连续性管理体系成熟度模型 186
第8章IT服务连续性内审的关键审核事项 189
8.1IT应急处置机制开发审计 189
8.1.1IT应急响应机制开发审计 189
8.1.2高可用恢复机制开发审计 191
8.1.3灾难恢复机制开发审计 192
8.2IT应急处置机制开发项目项目管理审计 198
8.3IT应急处置资源运维管理审计 200
8.4IT应急处置资源风险管理审计 201
8.5IT应急处置机制就绪管理审计 202
8.6IT应急响应与恢复行动审计 203
8.7IT应急处置机制持续更新管理审计 203
8.8IT服务连续性绩效管理审计 204
8.9IT服务连续性内控审计 205
附录A高可用风险检查列表库 207