• 全新正版 SRE原理与实践:构建高可靠性互联网应用 张观石 9787111715825 机械工业出版社
  • 全新正版 SRE原理与实践:构建高可靠性互联网应用 张观石 9787111715825 机械工业出版社
21年品牌 40万+商家 超1.5亿件商品

全新正版 SRE原理与实践:构建高可靠性互联网应用 张观石 9787111715825 机械工业出版社

本店所售图书,保证正版新书,有个别图片和实书封面不一样,以实书封面为准,最快当天,一般隔天发货。支持7天无理由退换货.开票联系客服

71.13 7.2折 99 全新

库存2件

北京西城
认证卖家担保交易快速发货售后保障

作者张观石

出版社机械工业出版社

ISBN9787111715825

出版时间2022-11

装帧平装

开本16开

定价99元

货号31617720

上书时间2023-05-12

剡溪书局

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
商品简介

这是一本从架构、开发、测试、运维全流程讲解如何进行软件可靠性工程建设的著作,它将帮助读者构建针对软件可靠性工程的完整的知识体系、工程体系和理论体系。

 


本书作者是虎牙科技的SRE架构师,他基于20余年的架构、研发和运维经验,用4年时间反复打磨,代表中国的工程师总结了中国互联网企业的SRE方法和经验。本书得到了中国SRE奠基人、虎牙科技CEO以及华为、腾讯、阿里、B站、亚马逊等企业的10余位技术专家高度评价并一致推荐。

 


本书参考传统可靠性工程及软件可靠性工程体系,把传统可靠性工程中的“六性”(可靠性、维修性、测试性、保障性、安全性、环境适应性)转化为互联网软件可靠性工程的6种能力(可靠性设计能力、观测能力、修复能力、保障能力、反脆弱能力、管理能力)。每一项能力都包括:互联网SRE体系中的概念、能力的设计、能力建设的原则与方法、能力的度量与改进,以及相应的实践案例。通过这6种能力把可靠性相关的工作组织起来,6种能力对应6个工作方向,不仅清晰地描绘出互联网软件可靠性工程体系的全貌,而且详细阐述了每一种能力的获得方法。

 


本书基于传统可靠性和软件可靠性的研究成果,借鉴和应用它们的成熟理论和工程方法,结合互联网软件的实际情况并加以融合和改进,提出了一套符合互联网时代的软件可靠性工程方法。
此外,本书还介绍了可靠性管理能力,对互联网软件开发团队、运维团队的技术领导者以及希望转型为可靠性工程师的传统运维人员、开发人员应该都有一定参考价值。



作者简介

张观石


资深运维专家和架构师,拥有20余年软件开发、架构、运维、SRE经验。目前就职于虎牙直播,历任项目研发负责人、SRE负责人、架构师,虎牙事故管理委员会委员、基础保障部架构师委员会委员。


为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定的保障体系,多次担任虎牙“英雄联盟全球总决赛直播”稳定性保障负责人。在混合多云架构、可观测性、预案、变更管控、AIOps等SRE领域有深入研究和丰富经验。


同时,他也是中国信通院分布式系统稳定性实验室高级技术专家,参与编写了《信息系统稳定性保障能力建设指南》。《运维前线》一书的联合作者。多次参与GOPS、MSUP、GDevops技术大会分享。


【媒体评论】

*董荣杰 虎牙科技CEO
“技术驱动娱乐”是虎牙直播秉承的理念。给用户提供不卡顿、不黑屏、低延迟、高画质的游戏直播服务是虎牙的追求。本书总结了虎牙技术团队驱动虎牙业务快速发展及支撑业务服务高质量高可靠的综合能力。找到技术背后的逻辑是工程师的一项非常重要的能力,相信本书介绍的方法也能适用于其他公司。

*丁宇(叔同) 阿里云智能云原生应用平台总经理
本书从可靠性工程的历史和体系说起,依次讲述了可靠性工程与软件生命周期、软件可靠性设计、可观测性、故障恢复与综合保障、反脆弱等多个方面,从自底向上设计、软件开发流程、持续运维过程、不同管理视角参与等多个维度,展示了如何系统化打造稳定、可靠的互联网应用。无论互联网的技术架构如何发展,可靠性、可用性都是最重要、最基本的要求。本书总结了虎牙直播在可靠性建设方面的实战经验,可以作为企业落地SRE的参考手册,助力企业打造出固若金汤的互联网应用服务。

*毛剑 bilibili 技术委员会主席
SRE是一项系统性工程,综合了工程方法论、经验、理念、自动化等多方面的技术和知识,是提供持续可靠、可用的大规模业务的重要保障。很高兴能看到越来越多国内公司及技术人员对于这个方向的持续探索和实践,为这个领域的发展贡献力量。

*徐勇州 腾讯云技术运营部总经理
可靠性对互联网应用至关重要,设立独立的SRE团队用于确保应用的可靠性已成为互联网公司的一项核心竞争力。观石在书中系统地阐述了可靠性工程的重要性,以及他是如何思考和践行可靠性工程的。这种理论结合实践的方式,能首先让读者更多地了解可靠性工程的全貌,并进一步深刻理解可靠性工程的六大能力(可靠性设计能力、观测能力、修复能力、 保障能力、反脆弱能力和管理能力),是业界一本难能可贵的体系化教程。



目录
推荐序1

 推荐序2

 推荐序3

 推荐序4

 赞誉

 前言

 第1章互联网软件可靠性概论1

 1.1为什么要研究互联网软件可靠性工程1

 1.1.1大型互联网企业的典型案例回顾1

 1.1.2研究互联网服务可靠性的迫切性和重要性3

 1.1.3研究软件可靠性工程是未来更复杂的软件产品发展的需要3

 1.2什么是可靠性工程3

 1.2.1可靠性与可靠性工程概述4

 1.2.2可靠性工程发展的3个阶段4

 1.2.3传统物理可靠性工程方法6

 1.3软件可靠性工程9

 1.3.1软件可靠性工程的概念9

 1.3.2软件可靠性工程发展的两个阶段10

 1.4互联网软件的可靠性16

 1.4.1相关名词介绍16

 1.4.2互联网软件可靠性工程现状及挑战18

 1.4.3互联网软件可靠性工程方法发展的3个阶段21

 1.5互联网软件可靠性工程的工作思路26

 1.5.1理解软件可靠性的3个核心问题26

 1.5.2建立可靠性工程体系框架的思路30

 1.6本章小结31

 第2章互联网软件可靠性工程及可靠性度量32

 2.1软件生命周期的可靠性工作32

 2.1.1互联网软件生命周期的可靠性工作及原则33

 2.1.2需求阶段的可靠性工作34

 2.1.3设计与实现阶段的可靠性工作35

 2.1.4测试与验证阶段的可靠性工作37

 2.1.5部署与发布阶段的可靠性工作38

 2.1.6持续运行阶段的可靠性工作39

 2.2故障生命周期的可靠性工作41

 2.2.1监控故障42

 2.2.2故障定界定位42

 2.2.3修复故障43

 2.3可靠性工程6种能力综述44

 2.4互联网软件可靠性度量与评价45

 2.4.1可靠性度量介绍45

 2.4.2可靠性度量和分析方法47

 2.4.3软件可靠性度量过程54

 2.4.4如何制定可靠性目标58

 2.5本章小结60

 第3章互联网软件可靠性设计与分析61

 3.1为什么要进行可靠性设计61

 3.1.1什么是可靠性设计61

 3.1.2可靠性是设计出来的62

 3.2可靠性设计原则与通用方法64

 3.2.1可靠性设计的原则64

 3.2.2可靠性设计的4种方法65

 3.3软件可靠性架构模型68

 3.4可靠性分析与架构风险72

 3.5可靠性分配74

 3.5.1可靠性分配的目的74

 3.5.2可靠性分配的原则75

 3.5.3可靠性分配的方法75

 3.6架构分层设计及其可靠性方法76

 3.6.1可靠性视角的分层架构77

 3.6.2业务架构的可靠性设计78

 3.6.3应用架构的可靠性设计78

 3.6.4系统架构的可靠性设计85

 3.6.5部署架构的可靠性设计92

 3.6.6基础设施架构的可靠性设计97

 3.6.7可靠性相关能力的设计99

 3.7架构可靠性评审99

 3.7.1评审目的99

 3.7.2评审过程100

 3.7.3评审方法101

 3.8可靠性预计102

 3.9本章小结103

 第4章可靠性观测能力建设与实践104

 4.1建设观测能力的目的104

 4.2排查、监控、观测技术的发展107

 4.2.1登录服务器通过系统命令排查问题107

 4.2.2集中式监控系统与日志系统110

 4.2.3可观测性115

 4.2.4观测能力与监控116

 4.2.5建立综合的观测能力117

 4.3监控观测的感知场景与感知方式118

 ……

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP