Nat Welch是一名美国的软件开发人员。自2005年以来,他一直做着网站构建及运维的工作。他热爱网站的基础设施建设,因为这可以支持其他人的创造性努力。2012年,Nat成为谷歌的SRE(Site Reliability Engineering,站点可靠性工程)工程师,并爱上了这个职业。从那时起,他在各种规模的公司工作过,并一直致力于提高网站的可靠性,以帮助开发人员构建可靠的系统。
发表于2024-12-28
SRE生存指南:系统中断响应与正常运行时间最大化 2024 pdf epub mobi 电子书
图书标签: 运维 计算机 系统管理 技术 工作学习 SRE IT
站点可靠性工程(Site Reliability Engineering,简称SRE)是一个令人兴奋的新兴领域,它专注于如何确保系统稳定、可靠地运行。本书基于一个金字塔层次结构模型,深入浅出地介绍了关于SRE的方方面面,涉及监控、事故响应与回顾、测试与发布、容量规划、开发、用户体验设计,以及贯穿其中的沟通技巧。
《SRE生存指南:系统中断响应与正常运行时间最大化》是SRE工程师、DevOps工程师、运维工程师和系统管理员不可或缺的参考资料;软件架构师、软件工程师、用户体验设计师也能从本书中获取关于SRE的相关知识。
整本书泛泛而谈吧, 提供了一些方法论的概述, 当做故事书读读看可能还行
评分整本书泛泛而谈吧, 提供了一些方法论的概述, 当做故事书读读看可能还行
评分整本书泛泛而谈吧, 提供了一些方法论的概述, 当做故事书读读看可能还行
评分作者为Google前SRE,书本内容比较泛也相对简单,适合一个企业从无到有建立SRE角色和团队做参考,也适合要成为SRE工程师的伙伴建立全局认识,不愧为“生存指南”的定位。书本框架还可以,主要是采用了Mikey金字塔内容展开。(BTW这就成了此书豆瓣第一个评论?)
评分整本书泛泛而谈吧, 提供了一些方法论的概述, 当做故事书读读看可能还行
SRE生存指南:系统中断响应与正常运行时间最大化 2024 pdf epub mobi 电子书