告警事件最佳实践处理流程
2016-06-30 16:00:43 0 举报
移动告警事件管理流程
作者其他创作
大纲/内容
开始
编写告警处理手册
监控设置
结束
故障处理结束
1.告警的及时性2.告警设置的有效性3.告警设置的合理性
工单关闭
告警事件最佳实践处理流程
对系统关键节点设置分层监控
否
1.客户感知节点;2.系统运行节点;3.主机资源节点4.根据级别设置处理时长
对告警处理进行优化
告警事件:是指系统实际行动运行达到或超过了预设的警戒阈值。可能影响用户使用或系统运行,由监控系统自动产生的报警事件。相关工具1.BOMC网管工具:亚信(上海,江西)、易阳系统(浙江)开发的BOMC系统,投诉、告警、协作任务的统一处理流转平台2.TOPTea(天津,湖南).类似于BOMC网管系统。3.TF/TASK作业监控工具(上海)。显示作业执行计划,跟踪执行结果,支持异常作业重新处理。上海自己开发。4.CBOSS监控系统(上海):对CBOSS系统运行状态进行统一管理平台。5.X86云化管理平台(浙江)。对X86架构下的后台进程进行集中监控,调度管理平台。一些好的方法:处理自动化。编写脚本,检测系统运行状态,自动重启异常进程,降低人员压力。处理界面化。使用处理界面。或者在BOMC上集成界面。避免频繁告警和增强告警监控:例如连续监测3次异常,才进行告警。避免频繁告警。对系统关键节点,除了在监控系统设置监控外,在单独进行告警。
一线处理人员收到工单通知
无法处理或者处理内容超出手册范围?
自行处理或根据告警手册处理告警工单
Start
二线人员处理故障
对告警清单进行分析
打电话给二线处理人员处理
监控优化
告警处理
产生告警工单

收藏

收藏
0 条评论
下一页
为你推荐
查看更多