k8s集群故障排除图
2020-05-14 14:58:49 12 举报
登录查看完整内容
k8s集群故障排除图解
作者其他创作
大纲/内容
?
修复Dockerfile
检查一下pod的状态是否为CrashLoopBackOff
否
你能看一份后端列表吗?
kubectl get pods
你是否忘记CMD中Dockerfile的说明?
是
Pods的状态是否是Running?
问题可能与CRI或者Kubelet有关系
修复这个应用。你应该监听0.0.0.0,更新容器端口
你能访问这个应用吗?
修复应用程序的问题
开始
判断是否达到了资源限制
kubectl describe pod <pod-name>
未知状态
提供更大的集群
修复路由的服务名称以及服务端口
你看到应用程序的日志了吗?
你是从私有仓库拉取的镜像吗?
你是否检查过日志和修复崩溃的程序呢?
Service运行正常
Scheduler出现问题
kubectl port-forward <pod-name> 8080:<pod-port>
此问题可以具体到路由的控制器;请查阅路由文档
结束
Pod是否重新启动?循环在Running 和CrashLoopBackoff两种状态中
这个问题可能与基础设施和集群的公开方式有关。
问题可能在于不断增加的容量
判断当前的镜像是否正确?
配置从私有仓库拉取镜像
你能看到endpoint列表吗?
查阅堆栈溢出
容器死的太快了吗?
pod是否分配给节点
修复挂掉的应用程序
判断当前镜像tag是否有效?是否存在?
修复Service的目标端口与容器端口
Pods的状态是否是Ready?
kubectl port-forward <ingress-pod-name> 8080:<ingress-port>
Pod运行正确
服务器上的目标端口是否与Pod中的容器端口匹配?
kubectl describe ingress <ingress-name>
判断这里是否有处PENDING状态的pod
修复tag
判断该容器暴漏的端口是否正确以及监听0.0.0.0?
kubectl port-forward service/<service-name> 8080:<service-port>
判断集群是否已经满了
判断pod的状态是否为RunContainerError?
放宽资源限制
修复镜像名称
kubectl get events
kube Proxy可能出现问题
Ingress正在正常运行
kubectl describe service<service-name>
控制管理器出现问题
修复liveness探针
是否正在装入挂起的持久卷申请
你能访问这个应用程序吗?
Kubelet出现问题
判断是否是Readiness探针失败
kubectl get pods -o wide
修复持久卷申请
判断Pod的状态是不是ImagePullBackOff
kubectl logs <pod-name>
选择器是否匹配正确的Pod标签?
Pod是否分配了IP地址?
判断服务名称跟服务端口是否匹配?
修理服务选择器;它必须与Pod标签匹配
kubectl logs <pod-name> --previous
kubelet出现问题
收藏
0 条评论
回复 删除
下一页