correction-of-error

问题复盘模板

何时该复盘:

  • 问题造成大面积业务异常

  • 问题很典型

  • 因流程缺乏或不合理导致的问题(借复盘完善当前流程或建立新流程)

备注:

  • 复盘不是追责,而是找到问题根因,避免下次再犯,同时完善当前不合理流程或建立新流程。

  • 复盘内容不要带上人名(以“工程师”替代)。

以下是模板内容:


问题描述

(描述问题)

问题影响

(问题对业务、数据等的影响,最好有数据,如影响了多少通电话、多少个用户、多少个请求)

时间线

(回顾问题发生前后的时间线)

为什么

(对问题进行思考回答,并非每个问题都需要回答)

问题是如何被检测到的?

为什么问题发生没有第一时间感知?

如何缩短问题发现的时间?

为什么问题发生后过了很久才被定位?

如何缩短问题定位的时间?

如何确保问题被彻底修复?

为什么代码审查阶段没有发现问题?

为什么测试阶段没有发现问题?

为什么部署后验证阶段没有发现问题?

为什么写代码的时候引入了此问题?

根因总结

(根据以上提问进行思考,总结出最根本的原因)

改进计划

(如何改进当前流程以避免问题再发生,后续跟进项和完成日期)

讨论记录

(组内复盘讨论记录)

Last updated