Kubernetes 出现问题排查
诊断应用程序
Debugging Pods
查看 Pod 的完整描述
1 | kubectl describe pods ${POD_NAME} |
注意观察 State Restart Count Conditions Events 字段
Pod一直是Pending
如果 Pod 一直停留在 Pending,意味着该 Pod 不能被调度到某一个节点上。通常,这是因为集群中缺乏足够的资源或者 合适 的资源。在上述 kubectl describe... 命令的输出中的 Events 字段,会有对应的事件描述为什么 Pod 不能调度到节点上。可能的原因有:
资源不就绪:创建 Pod 时,有时候需要依赖于集群中的其他对象, ConfigMap(配置字典)、PVC(存储卷声明)等,例如
可能该 Pod 需要的存储卷声明尚未与存储卷绑定,Events 信息如下所示:
1
2
3Type Reason Age From Message
---- ------ ---- ---- -------
Warning FailedScheduling <unknown> default-scheduler pod has unbound immediate PersistentVolumeClaims (repated 2 times)
缺乏足够的资源:可能集群中的CPU或内存都已经耗尽,此时,可以尝试:
- 删除某些 Pod
- 调整Pod的资源请求
- 向集群中添加新的节点
该Pod使用
hostPort: 当Pod使用hostPort时,该Pod可以调度的地方就比较有限了。大多数情况下,是不需要使用hostPort的,可以尝试使用 Service 访问 Pod。如果您确实需要使用hostPort时,Deployment/ReplicationController 中 replicas 副本数不能超过集群中的节点数,因为每台机器的 80 端口只有一个,任何其他端口也只有一个。如果该端口被其他程序占用了,也将导致Pod调度不成功污点和容忍: 当在Pod的事件中看到
Taints或Tolerations这两个单词时,可以检查Pod是否存在污点或者容忍
Pod一直是Wating
如果 Pod 停留在 Waiting 状态,此时该 Pod 已经被调度到某个节点上了,但是却不能运行。
注意 Events 字段的内容。最常见的 Pod 停留在 Waiting 状态的原因是抓取容器镜像失败。请检查:
- 容器镜像的名字是对的
- 容器镜像已经推送到了镜像仓库中
- 在对应的节点上手工执行
docker pull命令,看是否能够抓取成功。
Pod已经Crash或者Unhealthy
此时通常是容器中应用程序的问题,检查容器的日志,以诊断容器中应用程序出现了何种故障:
1 | kubectl logs ${POD_NAME} ${CONTAINER_NAME} |
如果容器之前 crash,通过上述命令查不到日志,可以尝试使用下面的命令查看上一次 crash 时的日志:
1 | kubectl logs --previous ${POD_NAME} ${CONTAINER_NAME} |
Pod处于Running状态,但是不工作
Pod已经处于Running状态了,但是不像期望的那样工作,此时,很有可能是部署描述yaml文件(例如 Pod、Deployment、StatefulSet等)出现了问题,而创建时,kubectl 忽略了该错误。
例如环境变量中某一个 Key 写错了,command 拼写成了 commnd 等。如果 command 拼写成了 commnd,仍然能够使用该 yaml 文件创建工作负载,但是容器在运行时,却不会使用原本期望的命令,而是执行了镜像中的 EntryPoint。
- 首先,在使用
kubectl apply -f命令之前,可以尝试为其添加--validate选项,例如,kubectl apply --validate -f mypod.yaml。如果将command拼写成commnd,将看到如下错误信息:
1 | [root@k8s-master 0425]# kubectl apply --validate -f security-context-1.yaml |
- 其次,请检查已经创建的 Pod 和预期的是一致的。执行命令
kubectl get pods/mypod -o yaml > mypod-on-apiserver.yaml。将输出结果与创建 Pod 时所使用的文件做一个对比。通常通过此命令从服务器端获取到的信息比创建 Pod 时所使用的文件要多几行,这是正常的。然而,如果创建的Pod时所示用的文件中,存在从服务器上获取的信息中没有的代码行,这可能就是问题所在了。
Debugging Deployment
Deployment(或者 DaemonSet/StatefulSet/Job等),都会比较直接,要么可以创建 Pod,要么不可以。
可以通过 kubectl describe deployment ${DEPLOYMENT_NAME} (或者statefulset / job 等)命令查看与 Deployment 相关的事件,来发现到底出了什么问题。
Debugging Service
Service 可以为一组 Pod 提供负载均衡的功能。
首先,检查Service的Endpoints。
1 | kubectl get endpoints ${SERVICE_NAME} |
请确保 enpoints 的个数与期望与该 Service 匹配的 Pod 的个数是相同的。例如,如果使用 Deployment 部署了 web-press,副本数为 2,此时,在输出结果的 ENDPOINTS 字段,应该有两个不同的 IP 地址。
Service中没有Endpoints
如果Service中没有Endpoints,请尝试使用 Service 的 label selector 查询一下是否存在 Pod。假设 Service 如下:
1 | ... |
执行如下命令可以查看 Service 所匹配的 Pod:
1 | kubectl get pods --selector=name=nginx,type=frontend -n ns1 |
如果 Pod 列表是期望的结果,但是 ENDPOINTS 还是空的,此时很可能是没有为 Service 指定正确的端口。
如果 Service 中指定的 containerPort 实际上并不存在于 Pod 中,该 Pod 不会被添加到 ENDPOINTS 列表里。请确保 Service 指定的 containerPort 在 Pod 中是可以访问的。
网络转发问题
如果客户端可以连接上 Service,但是连接很快就被断开了,并且 endpoints 中有合适的内容,此时,有可能是 proxy 不能转发到 Pod 上。
请检查:
- Pod是否正常工作?
kubectl get pods查看 Pod 的 restart count,诊断一下 Pod 是否有问题。 - 是否可以直接连接到 Pod ?
kubectl get pods -o wide可以获得 Pod 的IP地址,从任意一个节点上执行ping命令,确认网络连接是否正常。 - 应用程序是否正常地监听了端口?Kubernetes 不对网络端口做映射,如果您的应用程序监听 8080 端口,则在 Service 中应该指定
containerPort为 8080。在任意节点上执行命令curl :可查看 Pod 中容器的端口是否正常。
诊断集群问题
查看集群中的节点:
1 | kubectl get nodes -o wide |
kube-开头的 Pod 都是 Kubernetes 集群的系统级组件calico-开头是的 calico 网络插件etcd-开头的是 etcdcoredns-开头的是 DNS 插件。假设 apiserver 可能有故障,可以执行以下命令以查看其日志
1 | kubectl logs -f kube-apiserver-demo-master-a-1 -n kube-system |
查看 kubelet 的日志
1 | journalctl -u kubelet |
集群故障的常见原因
一部分 kubernetes 集群常见的故障原因以及应对办法:
可能的 Root causes:
- 虚拟机(或所在物理机)停机
- 集群内部发生网络不通的情况,或者集群和用户之间网络不通
- Kubernetes 系统组件崩溃
- 数据丢失,或持久化存储不可用
具体的故障场景有:
- Apiserver 所在虚拟机 shotdown 或者 apiserver 崩溃
- 导致的结果:
- 不能创建、停止、更新 Pod、Service、Deployment等
- 已有的 Pod 和 Service 仍然能够正常工作,除非该 Pod 或 Service 需要调用 Kubernetes 的接口,例如 Kubernetes Dashboard 和 Kuboard
- 导致的结果:
- Apiserver 的后端数据丢失
- 导致的结果:
- apiserver 将不能再启动
- 已有的 Pod 和 Service 仍然能够正常工作,除非该 Pod 或 Service 需要调用 Kubernetes 的接口,例如 Kubernetes Dashboard 和 Kuboard
- 需要手工恢复(或重建) apiserver 的数据才能启动 apiserver
- 导致的结果:
- 其他 Master 组件崩溃
- 导致的结果和 apiserver 相同
- 个别节点(虚拟机或物理机)停机
- 导致的结果
- 该节点上的所有 Pod 不再运行
- 导致的结果
- 网络分片
- 导致的结果
- 区域A认为区域B中的节点已死机;区域B认为区域A中的 apiserver 已死机(假设apiserver在区域A)
- 导致的结果
- kubelet 软件故障
- 导致的结果
- 已崩溃的 Kubelet 不能在该节点上再创建新的 Pod
- kubelet 有可能错误地删除了 Pod
- 节点被标记为
unhealthy - Deployment/ReplicationController 在其他节点创建新的 Pod
- 导致的结果
- 集群管理员的人为错误
- 导致的结果
- 丢失 Pod、Service 等
- 丢失 apiserver 的数据
- 用户不能访问接口,等等
- 导致的结果
应对办法:
- Action: 为 apiserver + etcd 使用 IaaS 供应商提供的稳定可靠的持久化存储
- 应对问题: Apiserver 的后端数据丢失
- Action: 使用高可用配置
- 应对问题:Apiserver 所在虚拟机 shotdown 或者 apiserver 崩溃
- 应对问题:其他 Master 组件崩溃
- 应对问题:个别节点(虚拟机或物理机)停机
- Action:周期性的为 apiserver 的 etcd 所使用的数据卷创建磁盘快照(Snapshot)
- 应对问题:Apiserver 的后端数据丢失
- 应对问题:集群管理员的人为错误
- 应对问题:kubelet 软件故障
- Action:使用Deployment/StatefulSet/DaemonSet 等控制器,而不是直接创建 Pod
- 应对问题:个别节点(虚拟机或物理机)停机,或者 kubelet 软件故障