当前位置：首页 > java >正文

pod重启次数过多怎么排查

java 2025/6/19 18:01:21

1、确认 Pod 状态

kubectl get pod <pod-name> -n <namespace> -o wide  # 查看重启次数、状态（如 CrashLoopBackOff）及所在节点

2、检查重启事件与退出码

kubectl describe pod <pod-name> -n <namespace> | grep -A 10 "Events"  # 查看最近事件
kubectl describe pod <pod-name> -n <namespace> | grep "Last State"     # 检查容器退出码

关键退出码解读

Exit Code 137：内存超限（OOMKilled），需检查内存限制。
Exit Code 1：应用内部错误（如配置缺失、启动失败）。
Exit Code 126/127：启动命令或镜像入口点错误。137	内存超限 (OOMKilled)	检查 resources.limits.memory
1	应用崩溃/配置错误	查看应用日志定位具体错误
126/127	启动命令权限或路径错误	验证容器入口点命令

3、查看崩溃前的日志

kubectl logs <pod-name> -n <namespace> --previous --timestamps  # 获取上一次容器

数据库连接失败（如 Connection refused）。
配置文件解析错误（如 FileNotFoundException）。
依赖服务不可用（如 ServiceUnavailable）。

4、其他可能得原因

资源超限

kubectl describe pod <pod-name> | grep -i "OOM"  # 确认是否因内存超限被杀
kubectl top pod <pod-name> --containers         # 实时监控资源使用（需安装 Metrics Server）

健康检查失败（Liveness Probe）

kubectl describe pod <pod-name> | grep -A 10 "Liveness"  # 检查探针配置

典型问题

5、进阶排查技巧
集群事件分析：相关的 Warning 事件（如节点资源不足、镜像拉取失败）

kubectl get events --sort-by=.metadata.creationTimestamp --namespace=<namespace>  # 按时间排序事件

资源配额检查：

kubectl describe pod <pod-name> | grep -E "Limits|Requests"  # 对比申请与限制
kubectl describe quota -n <namespace>                       # 检查命名空间配额

节点状态排查：

kubectl describe node <node-name> | grep -i "memory|cpu"  # 检查节点资源压力
kubectl get nodes                                         # 确认节点是否 Ready

查看全文

http://www.xdnf.cn/news/13686.html

数据结构散列表学习 2025年6月12日15:30:48

旧物新生，绿色领航——旧物二手回收软件开启资源循环新篇章

超维智联质胜千里：晨控 RFID 驱动汽车后视镜智造跃迁

离婚房产分割折价款计算的司法裁判策略

13.15 LLaMA 3+LangChain重构语法学习：可视化语法树+智能纠错让效率翻倍！

VScode使用npm启动项目以及npm install ,npm start报错问题处理

ThreadLocal原理及内存泄漏分析

EVNIA 27M2N3500UK显示器荣膺TÜV莱茵圆偏光认证，树立健康显示新标杆

Web 架构之 Kubernetes 弹性伸缩策略设计

CHI协议验证中的异常及边界验证

输电线防山火在线监测装置：科技赋能电网安全防线

泛微OAe9-自定义资源看板

纯血HarmonyOS ArKTS NETX 5 打造小游戏实践：大鱼吃小鱼（附源文件）

G1周打卡——GAN入门

考研系列—408真题操作系统篇（2015-2019）

煜邦智源SNEC全球首发智慧储能系统，携手德国莱茵TÜV加速全球化布局

Java 中使用 Redis 注解版缓存——补充

Qt Creator 从入门到项目实战

「pandas 与 numpy」数据分析与处理全流程【数据分析全栈攻略：爬虫+处理+可视化+报告】

图论算法1

2022年TASE SCI2区，学习灰狼算法LGWO+随机柔性车间调度，深度解析+性能实测

手写muduo网络库（七）：深入剖析 Acceptor 类

【leetcode】226. 翻转二叉树

专题：2025年跨境B2B采购买家行为分析及采购渠道研究报告|附160+份报告PDF汇总下载

公网 IP 地址SSL证书实现 HTTPS 访问完全指南

暴雨亮相2025中关村论坛数字金融与金融安全大会

相关文章：