可靠发布

发布协调工程师

  • 审核新产品和内部服务,确保符合可靠性标准和最佳实践
  • 负责发布过程中的所有技术相关问题,发布过程的“守门人”
  • 培训开发者最佳实践

建立发布流程

  • 简单、可扩展并高度定制的发布流程
  • 保证通用路径快速完成
  • 发布检查列表减少失败
    • 架构和依赖
    • 容量规划
    • 故障模式
    • 客户端行为,如用户滥用
    • 人工执行的流程文档化
    • 开发流程,如配置文件和发布分支
    • 外部依赖,如第三方库或合作伙伴
    • 发布计划

可靠发布方法论

  • 灰度和阶段性发布
  • 功能开关框架,用于开启或屏蔽变更
  • 应对客户滥用行为
    • 分散客户请求
    • 周期性任务引入随机性
    • 服务器控制客户端行为
  • 过载保护和压力测试

挑战

  • 扩展性的改变,比如数量级的扩展需要重新设计架构
  • 不断增加的运维压力
  • 基础设施的改变,需要引入更多的自动化
Feisky wechat
微信公众号订阅