平台故障处理流程
2016-12-28 13:42:15 0 举报
当平台出现故障时,首先需要确认故障的具体表现和影响范围。然后,根据故障的严重程度和紧急程度,启动相应的应急响应机制,包括通知相关人员、组织技术人员进行排查和修复等。在处理过程中,需要及时记录故障的处理过程和结果,以便后续分析和总结经验教训。同时,还需要与用户进行沟通和协调,告知故障的情况和预计恢复时间,并尽力减少对用户的影响。最后,在故障处理完成后,需要进行全面的测试和验证,确保平台的稳定性和可靠性。整个故障处理流程需要高效、协作、透明,以保障平台的正常运行和用户的满意度。
作者其他创作
大纲/内容
验收结束报告其他部门及领导
被通知的故障 + 部门内部发现的故障明确故障现象故障判断,定级,(3方 邮件、群聊、线下开会方式)
N
发现故障(bug)
运营,资产,财务
产品
出现故障修复时间段,对线上用户,不做任何展示,在短时间内(3~5分钟,不超过10分钟),使用临时解决方法或回滚方法去恢复使线上用户正常使用平台。具体情况具体分析。(例如:活动页面的问题-立刻关闭banner图,切断用户进入问题页面的途径。)重点:1. 减少平台损失, 2. 使用户快速正常使用平台, 3. 及时报告领导故障修复的进度。
钉钉提审批
未及时处理时,找出原因,并故障升级处理,并做检讨。(产品,开发,测试 3方)通知各部门和领导
故障提禅道,归档
开发
线上修复完毕
通知开发部,测试部
测试
发现
定修复时间,定解决方案(3级以上故障的解决方案及时向领导汇报)
Y
通知产品部
上线验收
归档故障升降级反映到绩效
领导
及时处理或回滚,测试
解决
根据实际给用户和公司的损失和对故障处理的及时程度再次判断将故障等级升降级
项目上线
定位
上线监控3天
是否3级以上(含)
归档记录根据故障等级记录到绩效评价中
运营中Bug处理流程
0 条评论
下一页