云端的SRE发展与实践

- - 美团点评技术团队

本文根据作者在美团点评第21期技术沙龙的分享记录整理而成. SRE（Site Reliability Engineering）是Google于2003年提出的概念，将软件研发引入运维工作. 现在渐渐已经成为各大互联网公司技术团队的标配. 美团点评作为综合性多业务的互联网+生活服务平台，覆盖“吃住行游购娱”各个领域，SRE就会面临一些特殊的挑战.

SRE 的工作介绍

- - 卡瓦邦噶！

有很多人问过我想了解一下 SRE 这个岗位，这是个很大的话题，在这篇博客中把想到的一些介绍一下吧. 这是一个最早由 Google 提出的概念，我的理解是，用软件解决运维问题. 标准化，自动化，可扩展，高可用是主要的工作内容. 这个岗位被提出的时候，想解决的问题是打破开发人员想要快速迭代，与运维人员想要保持稳定，拒绝频繁更新之间的矛盾.

【编者的话】Google在10年前创造了SRE这个工种. SRE，Site Reliability Engineering的缩写. 其中site是指Website，可以翻译为网站可靠性工程. 几年前资深Google SRE Chris Jones等人联合撰写了《Google SRE: How Google runs production systems》，首次向外界解密了Google的生产环境以及整个SRE的方法论.

SRE 与 DevOps 有什么不同？

- - IT瘾-dev

SRE和DevOps有什么区别. 您可能会说这很大程度上是语义问题，实际上，SRE和DevOps工程师扮演着相同的基本角色. 尽管如此，SRE和DevOps之间还是存在一些区别，即使是细微的区别. 考虑到这两种角色在很大程度上具有相同的价值观和实践，它们似乎并不重要，但现实是，最终SRE和DevOps工程师满足了不同的需求.

DevOps和SRE的区别 - 知乎

- -

最近有一位朋友和我聊职业发展方向问题，聊了不少 DevOps 和 SRE 话题. 我几年前刚接触这两个概念时也常常将之混淆，可惜当时没有人来解答我困惑. 现在这虽然已经极为流行，但是我发现我这位朋友对这两个职位还存在一些误区. 于是我给了一些见解并整理成文章以饕大众. DevOps 新概念，好高级哦.

SRE:“正确做事”的法门

- - DockOne.io

【编者的话】本文是作者多年SRE实践的经验总结，阐明了为什么要选择SRE及SRE的目标，并从六个角度指明如何实践SRE：合作和沟通、人员团队结构、工具和平台、版本工程学、监控、事后回顾. 本文是我对SRE实践的介绍，这些实践来自于我组建过的不同SRE团队，这些团队负责管理SAAS平台快速添加特性. 为什么选择Site Reliability Engineering (SRE)?.

什么是 SRE？与 DevOps 相比，到底谁才是真正的王者

- - IT瘾-dev

有很多人问过我想了解一下 SRE 这个岗位，这是个很大的话题，在这篇博客中把想到的一些介绍一下吧. 这是一个最早由 Google 提出的概念，我的理解是，用软件解决运维问题. 标准化，自动化，可扩展，高可用是主要的工作内容. 这个岗位被提出的时候，想解决的问题是打破开发人员想要快速迭代，与运维人员想要保持稳定，拒绝频繁更新之间的矛盾.

Kubernetes组件问题排查思路 – 十点运维吧-Linux|Kubernetes|Docker|Prometheus|Python|Golang|云原生|SRE

- -

Kubernetes的基础组件就像一栋房子的地基，它们的重要性不言而喻. 作为Kubernetes集群的维护者，经常会遇到组件的问题，那平时是怎么去定位解决的呢. 这里简要分析一下我的排查思路. 通过集群的状态，找到故障的节点或者组件. 使用pprof分析组件的具体性能. Kubernetes的基础组件不多，而且部署也非常简单，所以在定义范围的时候还是很容易的，比如我们在使用.

在云端

- Linker Lin - YesKafei Daily

腾云驾雾的旅行似乎就要实现了. 每次搭乘航班，都会选靠窗的座位，为了欣赏永远看不厌烦的云层. Passing Cloud 仍然是一个飞艇的概念，他是由多个尼龙气球支撑的不锈钢结构. 但与飞艇不同，它没有内部空间，乘客通过楼梯爬上“云层”顶端，在寒意中欣赏旅行中的云层和地面. Passing Cloud 没有自身的动力，只依靠风速和风向.

云端中的电视

- 云飞风起 - 月光博客

　　如同书籍、音乐等各种媒体的互联网化一样，电视正在朝云端发展. Netflix、Hulu、Apple TV正在将传统的电视剧和电影搬上屏幕，Youtube越来越吸引用户的注意力，comScore数据表明，美国用户有7%的上网时间花在了Youtube上. 　　然而，现实证明电视（电影）业比其他形式的媒体更难以改变.

云端的SRE发展与实践

背景

SRE演进之路

手工时代

云基础设施

问题＆解决方案

云计算基础设施架构

运维自动化

数据运营

职责＆使命

业务稳定性保障实践

故障起因&实例

经验总结

用户体验优化

未来展望

作者简介

相关 [云端 sre 发展] 推荐：