021-53098865

18018650584


​​学院动态

College dynamics

Google SRE 最佳实践分享走进《数据中心服务能力成熟度模型》国标修订启动会


2021年5月20日-21日,由全国信息化标准化技术委员会信息技术服务分技术委员会指导,中信银行股份有限公司主办,北京广通信达软件股份有限公司承办的GB/T 33136-2016《数据中心服务能力成熟度模型》国标修订启动会(以下简称国标修订启动会)及启动仪式在杭州钱塘江畔隆重召开。

中国SRE研究会首席讲师刘峰在大会上,分享了Google SRE相关议题,从理念情况、体系建设和DevOps实践三个维度重点强调了SRE的核心原则与落地实践,代表业内对管理大型复杂服务最佳实践的突破。




刘峰老师是互联网IT管理领域资深实战专家,具备超过15年IT服务管理以及开发运维一体化咨询工作和讲师经历。作为国内SRE首批实践者、大中国区第一位SRE讲师,中国SRE研究会创始人,具备互联网、金融科技、移动运营商的跨行业咨询经验。刘峰老师为中国移动、招商银行、平安银行、华夏银行、国家开发银行、上海银行、IBM、中国惠普、埃森哲、甲骨文、VMware等提供过专业服务。

Google SRE实践总结:
传统运维模式(Dev/Ops分离的团队模式)冲突的焦点为:1.直接成本相对清晰。2.间接成本差异较大(背景、技术能力、工具习惯、工作目标)。初步演变为目标与方向上的分歧以及内部沟通严重问题,上升到部门之间的信任与尊重。

传统运维模式(Dev/Ops分离的团队模式)冲突的焦点为:1.传统研发团队和运维团队分歧的焦点主要在软件新版本、新配置的变更的发布速度上。2.开发团队宣称不再进行大规模的程序更新,改为功能开关调整、增量更新和补丁化(大变更→小变更),为了绕开运维团队设立的各种流程,从而更快地上线新功能。


Google的解决之道:SRE
•SRE团队的组成:
1)50%~60%软件工程师
2)其他具备85%~99%软件技能,且具备一定程度其他技能(UNIX和网络)的工程师。

•SRE模型的优势:
1)运维人数相对少;
2)开发团队和运维团队的冲突焦点消除;
3)SRE团队和研发团队之间的成员可以自由流动。

•SRE模型的问题:就是如何招聘合适的SRE,一直存在。


Google SRE作为业内对管理大型复杂服务最佳实践的突破,为GB/T 33136-2016 《数据中心服务能力成熟度模型》国标修订工作提供坚实的支撑。通过构建数据中心运维知识生态体系,打造运维界内共享经济,成为数据中心用户的连接点,实现生态互通,提升其成熟度能力,高效赋能用户数字化转型。