当前位置: 首页 > news >正文

高并发计数器LongAdder 实现原理与使用场景详解

LongAdder 原理与应用详解


一、设计背景与核心思想

1. 传统原子类的性能瓶颈

  • AtomicInteger/AtomicLong 基于 CAS 实现
  • 高并发场景缺陷
    • CAS 失败率随竞争加剧指数上升
    • CPU 空转消耗大量资源
    • 缓存一致性流量(MESI协议)导致总线风暴

2. LongAdder 设计目标

  • 降低竞争:通过数据分片分散写压力
  • 空间换时间:牺牲部分内存换取更高吞吐
  • 最终一致性:允许读取结果存在短暂误差

二、实现原理剖析

1. 核心数据结构

// 基础值(无竞争时直接操作)
transient volatile long base;// 分片单元数组(应对高并发)
transient volatile Cell[] cells;// 分片单元结构(避免伪共享)
@jdk.internal.vm.annotation.Contended
static final class Cell {volatile long value;Cell(long x) { value = x; }
}

2. 分段累加流程

无竞争
成功
失败
有竞争
存在
成功
失败
不存在
调用 add 方法
是否存在竞争?
尝试 CAS 更新 base
操作完成
进入分片逻辑
获取当前线程的哈希值
对应 Cell 是否存在?
尝试 CAS 更新 Cell
扩容 cells 数组
新建 Cell 并插入数组

3. 伪共享解决方案

  • 问题根源:不同线程的变量共享同一缓存行(通常 64 字节)
  • 优化方案
    • 使用 @Contended 注解自动填充
    • 每个 Cell 独占缓存行
    • 内存布局示意:
      | Cell1 (64字节) | Cell2 (64字节) | ... |
      

三、关键操作解析

1. 累加操作(add)

public void add(long x) {Cell[] cs; long b, v; int m; Cell c;if ((cs = cells) != null || !casBase(b = base, b + x)) {boolean uncontended = true;if (cs == null || (m = cs.length - 1) < 0 ||(c = cs[getProbe() & m]) == null ||!(uncontended = c.cas(v = c.value, v + x)))longAccumulate(x, null, uncontended);}
}
  • 执行策略
    1. 优先尝试更新 base
    2. 失败后定位到线程对应的 Cell
    3. 多级失败后触发数组扩容

2. 取值操作(sum)

public long sum() {Cell[] cs = cells;long sum = base;if (cs != null) {for (Cell c : cs)if (c != null) sum += c.value;}return sum;
}
  • 特点
    • 非原子快照(可能包含进行中的更新)
    • 时间复杂度 O(n)(需遍历所有 Cell)

四、示例

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.atomic.LongAdder;public class SimpleLongAdderExample {public static void main(String[] args) throws InterruptedException {// 1. 创建LongAdder实例LongAdder counter = new LongAdder();// 2. 创建线程池(模拟并发请求)ExecutorService executor = Executors.newFixedThreadPool(10);// 3. 提交100个累加任务for (int i = 0; i < 100; i++) {executor.submit(() -> {// 每个任务累加1000次for (int j = 0; j < 1000; j++) {counter.increment(); // 等同于add(1)}});}// 4. 关闭线程池并等待任务完成executor.shutdown();executor.awaitTermination(1, TimeUnit.MINUTES);// 5. 输出最终结果System.out.println("最终计数: " + counter.sum()); // 应输出100000}
}

五、性能对比数据

测试环境:

  • CPU:8 核 Intel i9-9900K
  • 内存:32GB DDR4
  • JVM:OpenJDK 17
  • 测试用例:32 线程执行 1 亿次累加
实现方案耗时 (ms)吞吐量 (ops/ms)内存占用
synchronized4,52022,123
AtomicLong1,28078,125
LongAdder235425,531
ThreadLocal 优化182549,450

六、应用场景指南

1. 推荐使用场景

场景类型典型用例优势说明
高频计数器网站 PV/UV 统计分散写竞争
监控指标采集QPS/TPS 统计允许最终一致性
分布式限流令牌桶算法实现避免 CAS 失败风暴
大数据聚合实时计算中间结果支持快速并行累加

2. 不适用场景

场景类型典型用例问题分析
精确原子操作库存扣减sum() 非原子快照
读多写少配置项更新AtomicLong 更高效
内存敏感场景海量独立计数器Cell 数组内存开销大

六、实现原理总结

设计要点实现方案解决的问题
竞争分散分片 Cell 数组降低 CAS 失败率
伪共享预防@Contended 注解提升缓存利用率
动态扩容按需创建 Cell平衡性能与内存
延迟初始化初始使用 base 变量减少内存开销
最终一致性sum() 合并所有 Cell保证最终结果正确性

通过理解 LongAdder 的设计哲学和实现细节,开发者可以在高并发场景中做出更优的技术选型,在保证线程安全的前提下实现 5-10 倍的性能提升。关键是要根据实际业务场景的读写比例、一致性要求和资源限制进行合理选择。

http://www.xdnf.cn/news/702775.html

相关文章:

  • Jmeter性能测试(应用场景、性能测试流程、搭建测试环境)
  • 实例与选项对象
  • SpringBoot+Vue+Echarts实现可视化图表的渲染
  • 自动生成程序的heap文件
  • #!/usr/bin/env python
  • JS中的属性描述符
  • Day 20
  • 生成式引擎在不同行业的应用案例
  • 第十章 Java基础-Static静态变量
  • 基于物理约束的稀疏IMU运动捕捉系统
  • spring和Mybatis的各种查询
  • Rust 学习笔记:使用迭代器改进 minigrep
  • 力扣刷题Day 61:子集(78)
  • 【案例94】笛卡尔积导致报“临时表空间不足”
  • bat 批处理通过拖拽,来获取拖入文件的信息
  • 【25-cv-00656】Whitewood律所代理Olga Drozdova 蝴蝶版权图维权案
  • 【Web应用】若依框架:基础篇07功能详解-定时任务
  • 不同坐标系下的 面积微元
  • Android-Room + WorkManager学习总结
  • 2G Nand Jlink烧录报错Failed to allocated 0x1B000000 bytes of memory!
  • 5G 核心网中 NRF 网元的功能、接口及参数详解
  • 8.7 使用 EAP-AKA 进行订阅转移
  • 星图云交通综合应用解决方案:破解交通基建抢建拖建、工程量大等难题,赋能智慧交通
  • 2025年5月AI科技领域周报(5.19-5.25):大模型多模态突破 具身智能开启机器人新纪元
  • DockThor: 免费的在线小分子“虚拟筛选”平台
  • 即插即用!全新记忆回溯策略:一种元启发式算法的进化更新机制,含完整免费MATLAB代码
  • 数字化时代,健康管理系统如何改变健康管理?
  • 数据库与缓存数据不一致的解决方法
  • 动态规划题解——爬楼梯(力扣70 easy)
  • python几行命令实现快速打包apk