问题排查&定位系统
必知框架&系统
RPC
缓存
流量调度
开关平台
配置推送
限流
预案平台
业务对账BCP
DB运维
机器&应用发布管理
业务运维
扩容
应用下线
机器置换
发布管理
无人值守
测试资源
度量管理
云账号管理
变更管理
问题定位Arthas
监控&告警
系统监控。主要监控系统层面,也就是虚拟机信息,例如 CPU负载,内存,磁盘,网络
应用监控。主要监控整个应用信息,例如 JVM 的 GC,线程,应用异常,慢 SQL 等
RPC调用情况
qps
rt
链路监控EAGLEEYE
调用链路
系统信息
内存
CPU
负载
网络
JVM
RPC服务信息
一些运维命令
扩容
需要扩容哪个机房,扩容多少台?
压测
压测计划
功能模块
场景
依赖关系
团队
应用
应用owner
依赖应用
依赖业务及影响
相关接口
相关表
压测目标QPS
压测计划
手段