SRE指导思想

拥抱风险

SRE旨在平衡快速创新和高效服务运营之间的风险,而不是简单的最大化服务在线时间。

SLO

减少琐事

如果系统正常运转中需要人工干预,应该将此认为是一种bug。“正常”的定义随系统的进步不断改变。

监控告警

监控的目标

建立信噪比高的监控系统

自动化

自动化的价值

自动化的演进

发布

发布工程哲学

持续构建与部署

配置文件

简单化

Comments

comments powered by Disqus