作者简介: Betsy Beyer,Google SRE团队的成员,该团队负责Google生产系统的运维。 Chris Jones,Google SRE团队的成员,该团队负责Google生产系统的运维。 Jennifer Petoff,Google SRE团队的成员,该团队负责Google生产系统的运维。 Niall Richard Murphy,Google SRE团队的成员,该团队负责Google生产系统的运维。 内容简介: 占据软件系统生命周期绝大部分时间的是使用阶段,而非设计或实现阶段。那么,为什么传统观点还要坚持认为软件工程师应该首要关注大规模计算系统的设计和开发呢?在这本论文和文章合集中,Google的SRE(Site Reliability Engineering)团队的关键成员解释了他们对于整个软件系统生命周期的贡献如何以及为何能够帮助Google成功地构建、部署、监控和运维一些世界上现存优选的软件系统。你可以学习到Google工程师在提高系统部署规模、改进可靠性和资源利用效率方面的指导思想与具体实践——这些都是能够直接应用的宝贵经验。 目录: Foreword Preface Part Ⅰ.Introduction 1.Introduction The Sysadmin Approach to Service Management Google's Approach to Service Management: Site Reliability Engineering Tenets of SRE The End of the Beginning 2.The Production Environment at 6oogle, from the Viewpoint of an SRE Hardware System Software That "Organizes" the Hardware Other System Software Our Software Infrastructure Our Development Environment Shakespeare: A Sample Service Part Ⅱ.Principles 3.Embracing Risk Managing Risk Measuring&nb ...
以下为对购买帮助不大的评价