SRE原理与实践 构建高可靠互联应用
¥
74.3
7.5折
¥
99
全新
库存8件
作者张观石
出版社机械工业出版社
ISBN9787111715825
出版时间2023-01
装帧平装
开本16开
定价99元
货号1202777849
上书时间2024-12-02
商品详情
- 品相描述:全新
- 商品描述
-
目录
推荐序1
推荐序2
推荐序3
推荐序4
赞誉
前言
第1章互联网软件可靠性概论1
1.1为什么要研究互联网软件可靠性工程1
1.1.1大型互联网企业的典型案例回顾1
1.1.2研究互联网服务可靠性的迫切性和重要性3
1.1.3研究软件可靠性工程是未来更复杂的软件产品发展的需要3
1.2什么是可靠性工程3
1.2.1可靠性与可靠性工程概述4
1.2.2可靠性工程发展的3个阶段4
1.2.3传统物理可靠性工程方法6
1.3软件可靠性工程9
1.3.1软件可靠性工程的概念9
1.3.2软件可靠性工程发展的两个阶段10
1.4互联网软件的可靠性16
1.4.1相关名词介绍16
1.4.2互联网软件可靠性工程现状及挑战18
1.4.3互联网软件可靠性工程方法发展的3个阶段21
1.5互联网软件可靠性工程的工作思路26
1.5.1理解软件可靠性的3个核心问题26
1.5.2建立可靠性工程体系框架的思路30
1.6本章小结31
第2章互联网软件可靠性工程及可靠性度量32
2.1软件生命周期的可靠性工作32
2.1.1互联网软件生命周期的可靠性工作及原则33
2.1.2需求阶段的可靠性工作34
2.1.3设计与实现阶段的可靠性工作35
2.1.4测试与验证阶段的可靠性工作37
2.1.5部署与发布阶段的可靠性工作38
2.1.6持续运行阶段的可靠性工作39
2.2故障生命周期的可靠性工作41
2.2.1监控故障42
2.2.2故障定界定位42
2.2.3修复故障43
2.3可靠性工程6种能力综述44
2.4互联网软件可靠性度量与评价45
2.4.1可靠性度量介绍45
2.4.2可靠性度量和分析方法47
2.4.3软件可靠性度量过程54
2.4.4如何制定可靠性目标58
2.5本章小结60
第3章互联网软件可靠性设计与分析61
3.1为什么要进行可靠性设计61
3.1.1什么是可靠性设计61
3.1.2可靠性是设计出来的62
3.2可靠性设计原则与通用方法64
3.2.1可靠性设计的原则64
3.2.2可靠性设计的4种方法65
3.3软件可靠性架构模型68
3.4可靠性分析与架构风险72
3.5可靠性分配74
3.5.1可靠性分配的目的74
3.5.2可靠性分配的原则75
3.5.3可靠性分配的方法75
3.6架构分层设计及其可靠性方法76
3.6.1可靠性视角的分层架构77
3.6.2业务架构的可靠性设计78
3.6.3应用架构的可靠性设计78
3.6.4系统架构的可靠性设计85
3.6.5部署架构的可靠性设计92
3.6.6基础设施架构的可靠性设计97
3.6.7可靠性相关能力的设计99
3.7架构可靠性评审99
3.7.1评审目的99
3.7.2评审过程100
3.7.3评审方法101
3.8可靠性预计102
3.9本章小结103
第4章可靠性观测能力建设与实践104
4.1建设观测能力的目的104
4.2排查、监控、观测技术的发展107
4.2.1登录服务器通过系统命令排查问题107
4.2.2集中式监控系统与日志系统110
4.2.3可观测性115
4.2.4观测能力与监控116
4.2.5建立综合的观测能力117
4.3监控观测的感知场景与感知方式118
……
内容摘要
这是一本从架构、开发、测试、运维全流程讲解如何进行软件可靠性工程建设的著作,它将帮助读者构建针对软件可靠性工程的完整的知识体系、工程体系和理论体系。
本书作者是虎牙科技的SRE架构师,他基于20余年的架构、研发和运维经验,用4年时间反复打磨,代表中国的工程师总结了中国互联网企业的SRE方法和经验。本书得到了中国SRE奠基人、虎牙科技CEO以及华为、腾讯、阿里、B站、亚马逊等企业的10余位技术专家高度评价并一致推荐。
本书参考传统可靠性工程及软件可靠性工程体系,把传统可靠性工程中的“六性”(可靠性、维修性、测试性、保障性、安全性、环境适应性)转化为互联网软件可靠性工程的6种能力(可靠性设计能力、观测能力、修复能力、保障能力、反脆弱能力、管理能力)。每一项能力都包括:互联网SRE体系中的概念、能力的设计、能力建设的原则与方法、能力的度量与改进,以及相应的实践案例。通过这6种能力把可靠性相关的工作组织起来,6种能力对应6个工作方向,不仅清晰地描绘出互联网软件可靠性工程体系的全貌,而且详细阐述了每一种能力的获得方法。
本书基于传统可靠性和软件可靠性的研究成果,借鉴和应用它们的成熟理论和工程方法,结合互联网软件的实际情况并加以融合和改进,提出了一套符合互联网时代的软件可靠性工程方法。
此外,本书还介绍了可靠性管理能力,对互联网软件开发团队、运维团队的技术领导者以及希望转型为可靠性工程师的传统运维人员、开发人员应该都有一定参考价值。
主编推荐
(1)作者背景资深:就职于虎牙直播,历任项目研发负责人、SRE负责人、架构师,虎牙事故管理委员会委员、基础保障部架构师委员会委员。
(2)作者经验丰富:拥有20年软件开发、架构、运维、SRE经验,为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定的保障体系。
(3)总结中国SRE实践:作者立足于本土SRE实践经验,历时4年精心打磨,帮助读者构建针对SRE的完整的知识体系、工程体系、理论体系。
(4)全流程讲解SRE:从架构、开发、测试、运维全流程讲解如何进行软件可靠性工程建设,总结了要符合时代要求的SRE方法论体系。
(4)建设SRE六种能力:详解SRE的6种能力(可靠性设计能力、观测能力、修复能力、保障能力、反脆弱能力、管理能力)的概念、设计、建设原则与方法、度量与改进。
(5)10余行业专家推荐:中国SRE奠基人、虎牙科技CEO以及华为、腾讯、阿里、B站、亚马逊等企业的10余位技术专家高度评价。
精彩内容
这是一本从架构、开发、测试、运维全流程讲解如何进行软件可靠性工程建设的著作,它将帮助读者构建针对软件可靠性工程的完整的知识体系、工程体系和理论体系。
本书作者是虎牙科技的SRE架构师,他基于20余年的架构、研发和运维经验,用4年时间反复打磨,代表中国的工程师总结了中国互联网企业的SRE方法和经验。本书得到了中国SRE奠基人、虎牙科技CEO以及华为、腾讯、阿里、B站、亚马逊等企业的10余位技术专家高度评价并一致推荐。
本书参考传统可靠性工程及软件可靠性工程体系,把传统可靠性工程中的“六性”(可靠性、维修性、测试性、保障性、安全性、环境适应性)转化为互联网软件可靠性工程的6种能力(可靠性设计能力、观测能力、修复能力、保障能力、反脆弱能力、管理能力)。每一项能力都包括:互联网SRE体系中的概念、能力的设计、能力建设的原则与方法、能力的度量与改进,以及相应的实践案例。通过这6种能力把可靠性相关的工作组织起来,6种能力对应6个工作方向,不仅清晰地描绘出互联网软件可靠性工程体系的全貌,而且详细阐述了每一种能力的获得方法。
本书基于传统可靠性和软件可靠性的研究成果,借鉴和应用它们的成熟理论和工程方法,结合互联网软件的实际情况并加以融合和改进,提出了一套符合互联网时代的软件可靠性工程方法。
此外,本书还介绍了可靠性管理能力,对互联网软件开发团队、运维团队的技术领导者以及希望转型为可靠性工程师的传统运维人员、开发人员应该都有一定参考价值。
— 没有更多了 —
以下为对购买帮助不大的评价