当前位置: 首页 > news >正文

hadoop.yarn 带时间的LRU 延迟删除

org.apache.hadoop.yarn.util.LRUCache

这是一个在 Hadoop YARN 中被使用的、实现了​​最近最少使用(LRU)​​策略的缓存。它主要用于存储那些可以被重新计算或获取,但访问代价较高的数据,通过缓存来提升系统性能。

整体设计与核心组件

LRUCache 的实现非常经典,它通过组合两个辅助类来完成其功能:

  • LRUCacheHashMap<K, CacheNode<V>>
    这是缓存的底层存储结构。它是一个继承自 java.util.LinkedHashMap 的类。
    LinkedHashMap 的构造函数中,accessOrder 参数被设置为 true 时,每次访问(get)一个元素,该元素都会被移动到链表的末尾。当插入新元素导致容量超出限制时,链表头部的元素(也就是最久未被访问的元素)就会被移除。这正是 LRU 策略的核心。

public class LRUCacheHashMap<K, V> extends LinkedHashMap<K, V> {private static final long serialVersionUID = 1L;// Maximum size of the cacheprivate int maxSize;/*** Constructor.** @param maxSize max size of the cache* @param accessOrder true for access-order, false for insertion-order*/public LRUCacheHashMap(int maxSize, boolean accessOrder) {super(maxSize, 0.75f, accessOrder);this.maxSize = maxSize;}@Overrideprotected boolean removeEldestEntry(Map.Entry<K, V> eldest) {return size() > maxSize;}
}

  • CacheNode<V>
    这是一个简单的包装类,定义在 CacheNode.java 中。它的作用是封装缓存的实际值 V,并记录下该值被存入缓存时的时间戳 cacheTime。这个时间戳是实现缓存过期的关键。

    // ... existing code ...
    public class CacheNode<V> {private V value;private long cacheTime;public CacheNode(V value) {this.value = value;cacheTime = Time.now();}// ... existing code ...
    }

LRUCache 提供了两个构造函数:

// ... existing code ...
public LRUCache(int capacity) {this(capacity, -1);
}public LRUCache(int capacity, long expireTimeMs) {cache = new LRUCacheHashMap<>(capacity, true);this.expireTimeMs = expireTimeMs;
}
// ... existing code ...
  • LRUCache(int capacity)
    创建一个有固定容量限制但永不过期的缓存。

  • LRUCache(int capacity, long expireTimeMs)
    创建一个既有容量限制,又有过期时间的缓存。expireTimeMs 是过期时间(毫秒),如果传入一个小于等于 0 的值,效果等同于永不过期。

get(K key) 方法

延迟删除,get不影响TTL

// ... existing code ...
public synchronized V get(K key) {CacheNode<V> cacheNode = cache.get(key);if (cacheNode != null) {if (expireTimeMs > 0 && Time.now() > cacheNode.getCacheTime() + expireTimeMs) {cache.remove(key);return null;}}return cacheNode == null ? null : cacheNode.get();
}
// ... existing code ...
  1. ​线程安全​
    该方法使用了 synchronized 关键字,确保了在多线程环境下对缓存的读操作是原子性的,避免了竞态条件。

  2. ​过期检查​
    在返回缓存值之前,它会检查是否设置了过期时间 (expireTimeMs > 0)。如果设置了,它会用当前时间 Time.now() 与条目的缓存时间 cacheNode.getCacheTime() 加上过期时长进行比较。如果发现条目已过期,它会从缓存中移除该条目并返回 null

  3. ​LRU 更新​
    调用 cache.get(key) 会触发底层 LRUCacheHashMap 的机制,将被访问的这个条目标记为“最近使用过”。

put(K key, V value) 方法

// ... existing code ...
public synchronized V put(K key, V value) {cache.put(key, new CacheNode<>(value));return value;
}
// ... existing code ...public CacheNode(V value){this.value = value;cacheTime = Time.now();}
  1. ​线程安全​
    同样使用 synchronized 保证了写操作的线程安全。

  2. ​包装与存储​
    它首先将要存入的 value 包装成一个 CacheNode 对象,这个过程会记录下当前的时间戳。然后将这个 CacheNode 存入底层的 LRUCacheHashMap

  3. ​LRU 驱逐​
    如果 put 操作导致缓存的大小超过了其容量(capacity),底层的 LRUCacheHashMap 会自动移除最久未被访问的条目。

TestLRUCache.java 中我们可以看到 LRUCache 的预期行为:

  • ​容量测试​
    测试代码创建了一个容量为 3LRUCache,并依次放入了 "1", "2", "3", "4" 四个元素。断言缓存大小为 3,并且键为 "1" 的条目已经被驱逐(assertNull(lruCache.get("1")))。

  • ​过期测试​
    测试代码放入一个元素后,线程休眠超过了过期时间,然后尝试获取该元素,断言缓存中已经没有该元素了(size() 变为 0)。


总结

LRUCache 是一个设计简洁、功能明确且线程安全的 LRU 缓存。它巧妙地利用了 LinkedHashMapaccessOrder 特性来实现 LRU 驱逐策略,并通过一个包装类 CacheNode 来额外支持了过期功能。这种实现方式在很多 Java 项目中都很常见,是学习和理解缓存设计的一个优秀范例。

http://www.xdnf.cn/news/1225279.html

相关文章:

  • Ubuntu-Server-24.04-LTS版本操作系统如何关闭自动更新,并移除不必要的内核
  • C#常见的转义字符
  • Vue3 setup、ref和reactive函数
  • Vue 详情模块 1
  • C++对象访问有访问权限是不是在ide里有效
  • 解决MySQL不能编译存储过程的问题
  • 《Java 程序设计》核心知识点梳理与深入探究
  • SpringMVC全局异常处理+拦截器使用+参数校验
  • 2025 腾讯广告算法大赛 Baseline 项目解析
  • 为什么MCP协议是AI集成的未来API
  • 向华为学习——IPD流程体系之IPD术语
  • 京东云轻量云服务器与腾讯云域名结合配置网站及申请SSL证书流程详解
  • 使用 whisper, 音频分割, 初步尝试,切割为小块,效果还不错 1
  • 服务器地域选择指南:深度分析北京/上海/广州节点对网站速度的影响
  • 宝塔服务器挂载数据盘
  • OPENGLPG第九版学习 - 纹理与帧缓存 part2
  • 在SQL SERVER 中,用SSMS 实现存储过程的每日自动调用
  • Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现道路汽车的检测识别(C#代码,UI界面版)
  • Django模型查询与性能调优:告别N+1问题
  • 【Java面试题】缓存穿透
  • Linux文件系统理解2
  • Trust Management System (TMS)
  • AR智能巡检系统:制造业设备管理的效率革新
  • 2025.8.1
  • 计算机(电脑)是什么?零基础硬件软件详解
  • 什么是三防平板电脑?三防平板有什么作用?
  • android MVC/MVP/MVVM/MVI架构发展历程和编写范式
  • LLM Prompt与开源模型资源(2)提示工程关键技术
  • WPF TreeView自带自定义滚动条
  • 基于OpenCV的cv2.solvePnP方法实现头部姿态估计