《建立 SRE 基础:在软件交付组织中引入站点可靠性工程的分步指南》

作者:

日期:2023-02-05

出版:

  • 219
  • 0
  • 0

作品总结

《建立 SRE 基础:在软件交付组织中引入站点可靠性工程的分步指南》

利用 SRE 提高服务的可扩展性和可靠性

站点可靠性工程 (SRE,Site Reliability Engineering) 由 Google 率先创建更具可扩展性和更可靠的大规模系统,现已成为当今最有价值的软件创新机会之一。 《建立 SRE 的基础》是一份简明实用的指南,展示了如何在您自己的组织中推动 SRE 的成功采用。 Vladyslav Ukis 博士介绍了一种循序渐进的方法,以建立正确的文化、组织和技术流程基础,快速实现“最小可行 SRE”并从中不断改进。

Ukis 博士广泛借鉴了他在一家大型医疗保健公司领导 SRE 转型之旅的亲身经历。在整个过程中,他回答了组织提出的有关 SRE 的具体问题,确定了陷阱,并展示了如何避免或克服它们。无论您在软件开发、工程或运营中扮演什么角色,本指南都将帮助您应用 SRE 来改善最重要的方面:用户和客户体验。

本书的主要内容介绍:

  • 了解 SRE 的工作原理、其在软件运营中的作用以及 SRE 转型的挑战
  • 评估组织的当前运营情况和 SRE 转型的准备情况
  • 实现组织支持并启动基础活动,包括 SLO 定义、警报、待命轮换、事件响应和基于错误预算的决策
  • 调整组织结构以支持全面的 SRE 转型
  • 衡量 SRE 计划的进展和成功
  • 在基础之外维持和推进您的 SRE 转型


“SRE的技术和原理不仅在这里有明确的定义,而且它们背后的基本原理也以一种坚持下去的方式进行了解释。这不是一些枯燥的定义,这是实用的、可用的理解。我可以毫无保留地全心全意地推荐这本书。这是一本关于一个重要主题的非常好的书,有助于推动我们学科的游戏向前发展!“

--摘自Continuous Delivery Ltd.创始人兼首席执行官David Farley对本书的评价


0条评论