运维告警体系建设
2021-12-01 13:47:01 6 举报
知己知彼百战不殆。运维事前的信息获取和呈现能力至关重要。好的告警体系能保障99%的稳定性。其他就是经验和能力来处理事故或者事务。
作者其他创作
大纲/内容
第2阶段,建设
TOMCAT
HTTPSTATUS
MEM
主机
电话
RequestNumber
业务状态可视化
REDIS
NGINX
ARMS应用性能监控
告警
HOST主机监控
钉钉微信
TPS
SLS日志监控
运维告警体系建设
PROCESS
值班组配置
第1阶段,建设
数据来源
不断持续优化
DISK
进程
ErrorNumber
告警可视化
ResponseTime
SRE应用运维+DEV运维研发
View告警可视化
短信
第3阶段,建设
SlowSql
业务组配置
数据
FullGC
CPU
MQ
JVM
MYSQL
PORT
AlertManger告警规则
AlertMonitor告警通知
监控
报警规则配置
ResponseBody
SYS系统运维+DBA数据库运维
0 条评论
回复 删除
下一页