correction-of-error
问题复盘模板
何时该复盘:
问题造成大面积业务异常
问题很典型
因流程缺乏或不合理导致的问题(借复盘完善当前流程或建立新流程)
备注:
复盘不是追责,而是找到问题根因,避免下次再犯,同时完善当前不合理流程或建立新流程。
复盘内容不要带上人名(以“工程师”替代)。
以下是模板内容:
问题描述
(描述问题)
问题影响
(问题对业务、数据等的影响,最好有数据,如影响了多少通电话、多少个用户、多少个请求)
时间线
(回顾问题发生前后的时间线)
为什么
(对问题进行思考回答,并非每个问题都需要回答)
问题是如何被检测到的?
为什么问题发生没有第一时间感知?
如何缩短问题发现的时间?
为什么问题发生后过了很久才被定位?
如何缩短问题定位的时间?
如何确保问题被彻底修复?
为什么代码审查阶段没有发现问题?
为什么测试阶段没有发现问题?
为什么部署后验证阶段没有发现问题?
为什么写代码的时候引入了此问题?
根因总结
(根据以上提问进行思考,总结出最根本的原因)
改进计划
(如何改进当前流程以避免问题再发生,后续跟进项和完成日期)
讨论记录
(组内复盘讨论记录)
Last updated