Kubernetes 故障排查 概述 故障诊断、事件分析、资源调试等技能。 集群状态检查 节点状态 组件状态 Pod 故障排查 Pod 状态分析 常见 Pod 状态 Pending ImagePullBackOff CrashLoopBackOff OOMKilled 网络故障排查 Service 连通性 DNS 排查 网络策略 存储故障排查 PV/PVC 问题 挂载问题 资源问题排查 资源配额 资源使用 日志收集 容器日志 系统日志 调试工具 kubectl debug 临时调试 Pod 常见场景 场景 1:应用无法访问 场景 2:Pod 调度失败 场景 3:集群证书问题 故障排查清单 | 问题类型 | 排查命令 | |----------|----------| | Pod 状态 | , | | 网络问题 | , DNS 测试 | | 存储问题 | , | | 资源问题 | , | | 调度问题 | , 检查节点资源 | | 认证问题 | 检查 ServiceAccount, RBAC | ---