当前位置: 首页 > ops >正文

Arthas:Java诊断利器实战指南

在Java应用开发和运维中,线上问题排查往往是一场与时间的赛跑。传统的日志分析、重启大法或JVM工具(如jstack、jmap)虽然有效,但存在操作复杂、无法实时追踪等问题。Arthas作为阿里巴巴开源的Java诊断工具,凭借无需重启应用、动态追踪代码、支持热更新等特性,成为开发者排查疑难杂症的“手术刀”。本文将从安装到实战,全面解析Arthas的核心功能。

一、Arthas 的核心优势
无侵入式诊断
无需修改代码或重启服务,直接连接目标JVM进程。
动态追踪能力
实时监控方法调用、参数、返回值、异常等细节。
生产环境友好
提供安全退出机制,避免因误操作导致服务异常。
丰富的命令生态
覆盖线程分析、类加载追踪、性能采样等高频场景。
二、快速安装与配置

  1. 安装方式

下载并启动(自动检测Java进程)

curl -O https://arthas.aliyun.com/arthas-boot.jar
在这里插入图片描述
java -jar arthas-boot.jar
启动后会列出当前所有Java进程,输入序号即可连接。
在这里插入图片描述

  1. Docker环境使用
    1) 将Arthas复制到容器内
    docker cp arthas-boot.jar <容器ID>:/tmp/
    2) 进入容器并启动
    docker exec -it <容器ID> /bin/bash
    查看java安装路径
    ps -ef |grep java
    在这里插入图片描述
    启动命令 /openj9jdk/bin/java -jar /tmp/arthas-boot.jar
    在这里插入图片描述
    在这里插入图片描述
    结果同上选定位的进程Id

三、高频场景与命令详解
场景1:CPU占用飙升
排查步骤:

  1. 查看最忙的3个线程
    thread -n 3
    在这里插入图片描述

  2. 追踪高耗时方法(单位:ms)
    trace com.example.Service * ‘#cost > 200’

  3. 监控方法参数和返回值(研发定位常用)
    1)、只观察返回值:
    watch com..class(包+类) method(方法) returnObj
    2)、观察入参和返回值(遍历深度设置为5,x=5):
    watch com.
    .class(包+类) method(方法) “{params,returnObj}” -x 5 -b -f
    3)、观察入参和返回值,并且根据入参过滤:
    watch com..class(包+类) method(方法) “{params,returnObj}” ‘params[2]==true’ -x 5 -b -f
    4)、观察入参和返回值(只观察5次调用情况,n=5):
    watch com.
    .class(包+类) method(方法) “{params,returnObj}” -x 1 -f -n 5
    watch com.***.class(包+类) method(方法) “{params,returnObj}” -x 8 -b -e

watch的几个参数的说明:
[b] 在方法调用之前观察
[e] 在方法异常之后观察
[s] 在方法返回之后观察
[f] 在方法结束之后(正常返回和异常返回)观察
[E] 开启正则表达式匹配,默认为通配符匹配
[x:] 指定输出结果的属性遍历深度,默认为 1

打印类的详细信息:
sc -d com..class(包+类)
打印出类的Field信息:
sc -d -f com.
.class(包+类)
打印出类的Field信息,遍历深度为2:
sc -d -f com.***.class(包+类) -x 2

sc的几个参数的说明:
[d] 输出当前类的详细信息,包括这个类所加载的原始文件来源、类的声明、加载的ClassLoader等详细信息。
如果一个类被多个ClassLoader所加载,则会出现多次
[E] 开启正则表达式匹配,默认为通配符匹配
[f] 输出当前类的成员变量信息(需要配合参数-d一起使用)
[x:] 指定输出静态变量时属性的遍历深度,默认为 0,即直接使用 toString 输出

7、
quit——退出当前 Arthas 客户端,其他 Arthas 客户端不受影响
stop——关闭 Arthas 服务端,所有 Arthas 客户端全部退出
如果只是退出当前的连接,可以用quit或者exit命令。Attach 到目标进程上的 arthas 还会继续运行,端口会保持开放,下次连接时可以直接连接上。

如果想完全退出 arthas,可以执行stop命令。生产环境里,一定要使用stop命令!、

场景2:内存泄漏排查

  1. 导出堆内存快照
    heapdump --live /tmp/heapdump.hprof

  2. 统计对象实例数
    ognl ‘@com.example.LeakyClass@instanceCount’

  3. 追踪大对象创建路径
    stack com.example.LeakyClass “”
    场景3:动态修改日志级别
    查看当前Logger配置
    logger

修改ROOT日志级别为DEBUG

logger --name ROOT --level DEBUG
四、核心命令速查表
在这里插入图片描述

五、生产环境最佳实践
安全第一

优先使用watch/trace等只读命令,避免redefine热更新引发稳定性问题。
诊断完成后务必执行stop彻底退出,防止残留连接占用资源。
性能影响控制

限制监控次数(-n 5)和遍历深度(-x 3)。
避免对高频方法(如核心交易链路)进行持续监控。
日志与记录

使用history -w /path/to/log保存操作历史。
结合tee命令同时输出到文件和屏幕:
trace com.example.Service * | tee /tmp/trace.log
六、Arthas 进阶技巧

  1. 批量执行命令

通过脚本执行多个命令

java -jar arthas-boot.jar -c “watch com.example.Service method; thread -n 3”
2. 结合Ognl表达式

调用静态方法获取系统配置

ognl ‘@com.example.ConfigUtils@getConfig(“timeout”)’

修改静态变量(谨慎!)

ognl ‘@com.example.GlobalConfig@DEBUG_MODE=true’
3. 火焰图分析

启动采样(默认持续30秒)

profiler start

生成HTML格式火焰图

profiler stop --format html
在这里插入图片描述

结语
Arthas 的核心理念是**“看得见的问题才是好问题”**。通过本文的实战指南,开发者可以快速掌握从基础监控到深度诊断的全链路技巧。无论是日常开发中的性能调优,还是凌晨三点的紧急故障排查,Arthas 都能成为你手中最锋利的“瑞士军刀”。

附录:

Arthas 官方文档
Arthas 实战案例集

http://www.xdnf.cn/news/7856.html

相关文章:

  • 游戏服务器开发:如何实现客户端与服务端通信
  • 【Unity 如何使用 Mixamo下载免费模型/动画资源】Mixamo 结合在 Unity 中的实现(Animtor动画系统,完整配置以及效果展示)
  • 如何通过小贝加速实现精准网络故障排查
  • 使用 Shadcn UI 构建 Java 桌面应用
  • 六:操作系统虚拟内存之缺页中断
  • PHP:经典编程语言在当代Web开发中的新活力
  • YOLOv4深度解析:从架构创新到工业落地的目标检测里程碑
  • git工具使用
  • 【VxWorks 实时操作系统(RTOS)】常用函数汇总
  • 期刊采编系统安装升级错误
  • 25_05_19Linux实战篇、第一章_01若依前后端部署之路(后端)
  • SpringBoot-SpringBoot源码解读
  • 自动化软件如何确保高可用性和容错性?
  • git中,给分支打标签
  • 第三章 MCU时钟树配置
  • 直线型绝对值位移传感器:精准测量的科技利刃
  • Linux查 ssh端口号和服务状态
  • 故障率预测:基于LSTM的GPU集群硬件健康监测系统(附Prometheus监控模板)
  • 基于 Redis 实现短信验证码登录功能的完整方案
  • matlab实现混沌扩频DCSK的仿真
  • 从运维告警到业务决策:可观测性正在重新定义企业数据基础设施
  • 8-码蹄集600题基础python篇
  • Web Workers 使用指南
  • 在Windows 上安装 OpenSSH 服务端
  • 【C语言】(10)—指针4
  • 卫星互联网:构建全球无缝通信网络的未来
  • Java---斐波那契那数列
  • 智防火灾,慧控能耗:物联网赋能金融行业电气安全革新
  • 软件设计师考试需背诵知识点
  • 微信小程序AI大模型流式输出实践与总结