当前位置: 首页 > ds >正文

RabbitMQ 断网自动重连失效

问题描述

某天晚上公司告警群里突然有消息堆积的告警,业务人员排查发现业务应用不消费消息了,由于是很多应用都不消费了,初步推断可能 rabbitMQ server 端出了问题,和阿里云技术支持沟通后发现升级了 RabbitMQ server 端,业务应用重启后消费正常了。

问题排查

第二天开始排查具体什么原因导致的不消费,理论上 RabbitMQ client 默认是开启自动重连功能的,为什么没有起作用?通过日志可以看到客户端和RabbitMQ server 端是进行了断网重连:

INFO  o.s.a.r.l.SimpleMessageListenerContainer Restarting Consumer@2590a554: tags=[[]], channel=Cached Rabbit Channel:
INFO  o.s.a.r.c.CachingConnectionFactory Created new connection: rabbitConnectionFactory

既然客户端有重连行为,那么就要继续排查为什么消息停止消费了。后续阿里的专家说可能是因为不同的 consumer 使用了相同的 consumerTag 导致的,之前其他客户也有遇到过。

通过查询 RabbitMQ 官方文档发现,确实当不同的consumer 使用相同的 consumerTag 会导致连接重连会出问题。
在这里插入图片描述
https://www.rabbitmq.com/client-libraries/java-api-guide#consuming

代码核查

先查看公司代码发现当调用 channel.basicConsume() 方法时,不同的 consumer 确实传入的 consumerTag 是一样的,印证了上述的推测。

再继续深究一下,查看 rabbitmq client 的代码,发现调用 channel.basicConsume() 方法时,最终是会把 consumerTag 和 consumer 存储在 AutorecoveringConnection 对象的 Map<String, RecordedConsumer> consumers 里面,consumerTag 是 key,一般情况下 Channel 是共享 Connection 的,所以当 consumerTag 相同时就会存在覆盖的情况。

public String basicConsume(String queue, boolean autoAck, String consumerTag, boolean noLocal, boolean exclusive, Map<String, Object> arguments, Consumer callback) throws IOException {final String result = delegate.basicConsume(queue, autoAck, consumerTag, noLocal, exclusive, arguments, callback);recordConsumer(result, queue, autoAck, exclusive, arguments, callback);return result;
}private void recordConsumer(String result,String queue,boolean autoAck,boolean exclusive,Map<String, Object> arguments,Consumer callback) {RecordedConsumer consumer = new RecordedConsumer(this, queue).autoAck(autoAck).consumerTag(result).exclusive(exclusive).arguments(arguments).consumer(callback);this.consumerTags.add(result);this.connection.recordConsumer(result, consumer);}
 void recordConsumer(String result, RecordedConsumer consumer) {this.consumers.put(result, consumer);}

下面是断网重连的逻辑,会从 consumers map 中取出 consumer 进行消费恢复:

private void recoverTopology(final ExecutorService executor) {// The recovery sequence is the following:// 1. Recover exchanges// 2. Recover queues// 3. Recover bindings// 4. Recover consumersif (executor == null) {// recover entities in serial on the main connection threadfor (final RecordedExchange exchange : Utility.copy(recordedExchanges).values()) {recoverExchange(exchange, true);}for (final Map.Entry<String, RecordedQueue> entry : Utility.copy(recordedQueues).entrySet()) {recoverQueue(entry.getKey(), entry.getValue(), true);}for (final RecordedBinding b : Utility.copy(recordedBindings)) {recoverBinding(b, true);}for (final Map.Entry<String, RecordedConsumer> entry : Utility.copy(consumers).entrySet()) {recoverConsumer(entry.getKey(), entry.getValue(), true);}} else {// Support recovering entities in parallel for connections that have a lot of queues, bindings, & consumers// A channel is single threaded, so group things by channel and recover 1 entity at a time per channel// We also need to recover 1 type of entity at a time in case channel1 has a binding to a queue that is currently owned and being recovered by channel2 for example// Note: invokeAll will block until all callables are completed and all returned futures will be complete try {recoverEntitiesAsynchronously(executor, Utility.copy(recordedExchanges).values());recoverEntitiesAsynchronously(executor, Utility.copy(recordedQueues).values());recoverEntitiesAsynchronously(executor, Utility.copy(recordedBindings));recoverEntitiesAsynchronously(executor, Utility.copy(consumers).values());} catch (final Exception cause) {final String message = "Caught an exception while recovering topology: " + cause.getMessage();final TopologyRecoveryException e = new TopologyRecoveryException(message, cause);getExceptionHandler().handleTopologyRecoveryException(delegate, null, e);}}}

问题解决

由上述的代码,可以发现问题出现在了不同的 consumer 使用了相同的 consumerTag 导致的,那么解决方案也就很清晰了,当调用 channel.basicConsume() 时,不同的 consumer 使用不同的 consumerTag。

http://www.xdnf.cn/news/8847.html

相关文章:

  • 3d世界坐标系转屏幕坐标系
  • 解锁未来AI:使用DACA模式和Agentic技术提高开发效率
  • TCP 的四次挥手
  • AI重塑数据治理的底层逻辑
  • Java求职者面试指南:Spring、Spring Boot、MyBatis技术栈深度解析
  • Windows逆向工程提升之异常处理机制
  • docker 镜像完整生成指南
  • ResponseBodyEmitter与SseEmitter使用
  • MyBatis实战指南(二)如何实现小鸟图标与导入Teacher数据库表实战
  • 《深入剖析:Python自动化测试框架之unittest与pytest》
  • 微服务——网关
  • TypeScript
  • OpenCV 第7课 图像处理之平滑(一)
  • Flink流水线集成Gravitino
  • 微软Build 2025五大AI发布
  • 人工智能数学基础实验(五):牛顿优化法-电动汽车充电站选址优化
  • 基于微信小程序的漫展系统的设计与实现
  • 研报精读:数据要素市场培育及企业数据资源会计处理实证研究【附全文阅读】
  • 基于opencv的全景图像拼接
  • 【ExcelVBA 】类模块学习从入门到放弃
  • 数据仓库中的业务域与数据域
  • 关于PHP的详细介绍,结合其核心特点、应用场景及2025年的技术发展趋势,以清晰的结构呈现:
  • 用HTML5实现实时ASCII艺术摄像头
  • git子模块--常见操作
  • HarmonyOS NEXT 技术特性:分布式软总线技术架构
  • OpenLayers 加载全屏显示控件
  • 【Fargo】razor框架调用mediasoup的发送和接收能力
  • FFT Shift
  • 双目视野高精度拼接
  • PCB设计教程【入门篇】——PCB设计基础-PCB构成与组成