当前位置：首页 > news >正文

Java八股文——Redis篇

news 2025/6/6 18:35:07

- 1. 缓存穿透
- - 解决方案
  - - 1. 缓存空值
    - 2. 布隆过滤器（Bloom Filter）
    - 3. 参数校验
    - 4. 接口限流与验证码
- 2. 缓存击穿
- - 解决方案
  - - 1. 设置热点数据永不过期（或很长过期时间）
    - 2. 使用互斥锁（如分布式锁）
    - 3. 利用异步更新 + 逻辑过期
    - 4. 提前预热缓存
- 3. 缓存雪崩
- - 解决方案
  - - 1. 缓存过期时间加随机值
    - 2. 利用Redis集群提高服务的可用性
    - 3. 使用多级缓存架构
    - 4. 请求限流与降级处理
  - 缓存三兄弟
- 4. 缓存双写一致性
- - 双写一致
  - 强一致性
  - 允许延时一致
- 5. Redis持久化
- - RDB的执行原理
  - AOF
  - RDB和AOF对比
- 6. Redis数据删除策略
- - 惰性删除
  - 定期删除
  - Redis的过期删除策略：惰性删除+定期删除两种策略配合使用
- 7. Redis数据淘汰策略
- 8. Redis分布式锁
- - Redis实现分布式锁如何合理的控制锁的有效时长？
  - Redisson实现的分布式锁-可重入
  - Redisson实现的分布式锁-主从一致性
- 9. Redis集群方案
- - 主从复制
  - - 主从数据同步原理
  - 哨兵模式
  - - 服务状态监控
    - 哨兵选主规则
    - redis集群（哨兵模式）脑裂
  - 分片集群
  - - 分片集群特征
    - 数据读写
- Redis是单线程的，但是为什么还那么快
- - 完全基于内存操作
  - 使用高性能的 I/O 多路复用机制
  - 单线程避免了锁竞争
  - Redis网络模型

1. 缓存穿透

缓存穿透是指：请求的数据在缓存（如 Redis）和数据库中都不存在，导致每次请求都会穿过缓存直接请求数据库，从而失去了缓存的意义，严重时可能压垮数据库。

解决方案

1. 缓存空值

即：对于查询结果为 null 的数据，也写入缓存。
示例：
```
SET user:999999 null EX 300
```
设置一个较短的过期时间，避免缓存占用过多空间。

缺点：可能消耗内存，或造成数据不一致的问题。

2. 布隆过滤器（Bloom Filter）

在访问缓存之前，先用布隆过滤器判断 key 是否可能存在；
若布隆过滤器判断为“不存在”，就直接拦截请求；
优点：占用空间小，性能高；
缺点：有误判率（可能判断存在，但实际不存在）。

布隆过滤器

采用bitmap（位图）数组。
存储数据：id为1的数据，通过多个hash函数获取hash值，根据hash计算数组对应位置改为1。
查询数据：使用相同hash函数获取hash值，判断对应位置是否都为1。
误判率可以在初始化时手动设置，一般为0.05.

3. 参数校验

对传入的参数（如 ID）进行格式校验；
非法参数直接拒绝请求，不查询缓存或数据库。

4. 接口限流与验证码

对频繁请求的 IP 或用户加限制；
对可疑请求增加验证码验证，避免恶意攻击。

2. 缓存击穿

缓存击穿是指：某个热点数据在缓存中失效（过期）的一瞬间，有大量并发请求同时访问该数据，由于缓存没有命中，导致这些请求都直接访问数据库，造成数据库压力剧增甚至宕机。

解决方案

1. 设置热点数据永不过期（或很长过期时间）

对于访问频繁的数据，可以设置较长 TTL，甚至不设过期时间；
由后台程序定期更新缓存，而不是自动失效。

2. 使用互斥锁（如分布式锁）

特点：强一致，性能差

当缓存失效时，只有一个线程能去加载数据库并回填缓存；
其余线程等待或短时间重试，防止并发访问数据库；

示例伪代码：

if (redis.get(key) == null) {if (acquireLock(key)) {value = queryDatabase();redis.set(key, value, ttl);releaseLock(key);} else {sleep(50ms);retry();}
}

3. 利用异步更新 + 逻辑过期

特点：高可用，性能优

缓存数据不真实删除，而是加上一个“逻辑过期时间”（在设置key的时候一并存入缓存）；
请求到达时若数据已逻辑过期，则：
- 先返回旧值；
- 异步由后台线程更新缓存，避免并发冲击；
常用于读多写少的场景（如热点文章详情页）。

4. 提前预热缓存

对于已知的热点数据（如大促商品、首页模块等），在系统启动或业务高峰前提前加载进缓存，避免过期带来的击穿。

3. 缓存雪崩

缓存雪崩是指：大量缓存数据在同一时间集中过期或失效或者Redis服务宕机，导致大批请求绕过缓存直接访问数据库，引起数据库压力骤增甚至崩溃，从而造成整个系统不可用。

解决方案

1. 缓存过期时间加随机值

避免所有 key 过期时间一致；
示例：设置过期时间为 600s + random(0~300s)；
这样 key 的过期时间分散，避免集中过期。

2. 利用Redis集群提高服务的可用性

主从复制 + 哨兵模式（Sentinel）

Redis 主从架构，主节点写、从节点读；
配合哨兵（Sentinel）自动监控主节点健康；
主节点宕机时，哨兵自动完成故障转移（选举新的主节点）；
客户端自动感知主节点变化，保障服务不中断。

Redis Cluster 模式

数据分片到多个节点，每个节点负责部分 key；
自动管理主从结构和数据分布；
某个节点宕机时，其从节点可自动顶替，保证整体服务可用；
适用于大数据量 + 高并发场景。

3. 使用多级缓存架构

如：本地缓存（Guava、Caffeine） + 分布式缓存（Redis）；
缓解 Redis 失效时对数据库的直接冲击；
缺点是增加系统复杂性。

4. 请求限流与降级处理

设置接口限流策略，避免短时间请求爆发；
数据库压力过高时返回降级数据（如旧值、提示信息等）；
保证系统核心功能可用。

缓存三兄弟

名称	触发条件	涉及 key	是否因攻击可控	解决重点
缓存穿透	缓存和数据库都无该数据	大量不存在的 key	可被恶意触发	拦截非法请求
缓存击穿	热点 key 过期被高并发访问	单个热点 key	部分可控	限流 + 加锁 + 异步更新
缓存雪崩	大量 key 同时过期	大批有效 key	通常不可控	平滑过期 + 异步预热

打油诗：

穿透无中生有key，布隆过滤null隔离。

缓存击穿过期key，锁与非期解难题。

雪崩大量过期key，过期时间要随机。

面试必考三兄弟，可用限流来保底。

4. 缓存双写一致性

双写一致

当修改了数据库的数据也要同时更新缓存的数据，缓存和数据库的数据要保持一致

读操作：缓存命中，直接返回；缓存未命中查询数据库，写入缓存，设定超时时间
写操作：延迟双删（删除缓存→修改数据库→延时时间→删除缓存）

强一致性

读多写少

共享锁：读锁readLock，加锁之后，其他线程可以共享读操作

排他锁：独占锁writeLock，加锁之后，阻塞其他线程读写操作

允许延时一致

异步通知保证数据的最终一致性。基于MQ
基于Canal的异步通知，canal监听mysql的binlog（记录了所有DDL和DML语句），canal是基于mysql的主从同步来实现的

5. Redis持久化

RDB全称Redis Database Backup file（Redis数据备份文件），也被叫做Redis数据快照。简单来说就是把内存中的所有数据都记录到磁盘中。当Redis实例故障重启后，从磁盘读取快照文件，恢复数据。

Redis内部有触发RDB的机制，可以在redis.conf文件中找到。save 900 1，900秒内如果有1个key被修改，则触发RDB

RDB的执行原理

bgsave开始时会fork主进程得到子进程，子进程共享主进程的内存数据。完成fork后读取内存数据并写入RDB文件。

fork采用的是copy-on-write技术：
- 当主进程执行读操作时，访问共享内存
- 当主进程执行写操作时，则会拷贝一份数据，执行写操作。

AOF

AOF全称为Append Only File（追加文件）。Redis处理的每一个写命令都会记录在AOF文件，可以看作是命令日志文件

AOF默认是关闭的，需要修改redis.conf配置文件来开启AOF：appendonly yes，appendfilename "test.aof"

AOF的命令记录的频率也可以通过redis.conf文件来配。

appendfsync always #表示每执行一次命令，立即记录到AOF文件
appendfsync everysec #写命令执行完先放入AOF缓冲区，然后表示每隔一秒将缓冲区数据写到AOF文件，默认
appendfsync no #写命令执行完先放入AOF缓冲区，由操作系统决定何时将缓冲区内容写回磁盘

因为是记录命令，AOF文件会比RDB文件大得多。而且AOF会记录对同一个key的多次写操作，但只有最后一次写操作才有意义。通过执行bgrewriteaof命令，可以让AOF文件执行重写功能，用最少的命令达到相同的效果。

Redis也会在触发阈值时自动去重写AOF文件。阈值可以在redis.conf中配置。

auto-aof-rewrite-percentage 100 #AOF文件比上次文件增长超过多少百分比则触发重写
auto-aof-rewrite-min-size 64mb #AOF文件体积最小多大以上才触发重写

RDB和AOF对比

特性	RDB（快照）	AOF（追加日志）
原理	周期性保存内存数据快照到磁盘（`.rdb` 文件）	每次写操作追加到日志文件（`.aof` 文件）
触发方式	自动（定时/满足条件）或手动触发 `SAVE`/`BGSAVE`	每次写操作都记录，后台异步写入
数据恢复速度	恢复快（加载 RDB 文件即可）	恢复较慢（需按日志重放命令）
数据安全性（丢失）	可能丢失最后一次快照后的数据	可配置为丢失毫秒级（appendfsync always）或秒级
文件大小	更小（结构化紧凑）	通常更大（命令日志）
性能开销	开销低，适合大数据量冷备	写操作频繁时开销大
适用场景	数据安全要求低、启动快	数据安全性要求高、日志追踪

6. Redis数据删除策略

惰性删除

设置该key过期时间后，我们不管它，当需要该key时，我们再检查是否过期，如果过期，我们就删掉，反之返回该key

优点：对CPU友好，只会在使用时才检查

缺点：对内存不友好，如果一个Key过期，但长期未使用，那么该key就会一直存放在内存中，永远不会释放

定期删除

每隔一段时间，我们就对一些key进行检查，删除里面过期的key（从一定数量的数据库中取出一定数量的随机key进行检查，并删除其中的过期key）

SLOW模式：定时任务，执行频率默认是10hz，每次不能超过25ms，以通过修改配置文件的 hz 选项调整
FAST模式执行频率不固定，但两次间隔不低于2ms，每次耗时不超过1ms

优点：可以通过限制删除操作执行的时长和频率来减少对删除操作对CPU的影响

缺点：难以确定删除操作执行的时长和频率。

Redis的过期删除策略：惰性删除+定期删除两种策略配合使用

7. Redis数据淘汰策略

Redis 的数据淘汰策略（Eviction Policy）是在内存用满时，决定哪些数据要被删除来腾出空间的策略。只有在配置了 maxmemory 且数据超出限制时才会触发。

策略名	含义说明
`noeviction`（默认）	不删除数据，内存满后写操作报错（适合缓存+持久化共存时）
`allkeys-lru`	在所有键中，淘汰最近最少使用的键
`volatile-lru`	在设置了过期时间的键中，淘汰最近最少使用的键
`allkeys-random`	所有键中，随机淘汰一个键
`volatile-random`	在设置了过期时间的键中，随机淘汰一个键
`volatile-ttl`	在设置了过期时间的键中，优先淘汰快要过期的
`allkeys-lfu`	所有键中，淘汰使用频率最少的（Redis 4.0+）
`volatile-lfu`	在有过期时间的键中，淘汰使用频率最少的

8. Redis分布式锁

Redis实现分布式锁主要利用Redis的setnx命令。setnx是SET if not exists（如果不存在，则SET）的简写

获取锁：

#添加锁，NX是互斥的，EX是设置超时时间
SET lock value NX EX 10

释放锁：
```
#释放锁，删除即可
DEL key
```

Redis实现分布式锁如何合理的控制锁的有效时长？

使用redisson实现分布式锁-执行流程。

看门狗机制，给锁续期
抢不到锁的线程，会重试等待
加锁、设置过期时间等操作都是基于lua脚本完成，保证执行的完整性。

Redisson实现的分布式锁-可重入

利用hash结构记录线程id和重入次数

Redisson实现的分布式锁-主从一致性

RedLock(红锁)：不能只在一个redis实例上创建锁，应该是在多个redis实例上创建锁（n/2 + 1），避免在一个redis实例上加锁。

不建议使用，如果非要保证强一致，可以采用zookeeper

9. Redis集群方案

主从复制

单节点Redis的并发能力是有上限的，要进一步提高Redis的并发能力，就需要搭建主从集群，实现读写分离。

主从数据同步原理

类型	含义
全量同步（Full Sync）	第一次连接、重连时使用，拷贝主节点全量数据
增量同步（Partial Resync）	在网络中断后尽可能同步缺失的命令，而不是全量

全量同步：

从节点请求主节点同步数据（replication id、offset）
主节点判断是否是第一次请i去，是第一次就与节点同步版本信息（replication id和offset）
主节点执行bgsave，生成rdb文件后，发送给从节点去执行
在rdb生成执行期间，主节点会以命令的方式记录到缓冲区（一个日志文件）
把生成之后的命令日志文件发送给从节点进行同步

增量同步：

从节点请求主节点同步数据，主节点判断不是第一次请求，获取从节点的offset值
主节点从命令日志中获取offset值之后的数据，发送给从节点进行同步

哨兵模式

Redis提供了哨兵（Sentinel）机制来实现主从集群的自动故障恢复。

监控：Sentinel会不断检查mater和slave
自动故障恢复：如果master故障，Sentinel会将一个slave提升至master。当故障实例恢复后也以新的master为主
通知：Sentinel充当Redis客户端的服务发现来源，当集群发生故障转移时，会将最新信息推送给Redis的客户端。

服务状态监控

Sentinel基于心跳机制检测服务状态，每隔1秒向集群的每个实例发送ping命令
- 主观下线：如果某sentinel节点发现某实例未在规定时间响应，则认为该实例主观下线。
- 客观下线：若超过指定数量（quorum）的sentinel都认为该实例主观下线，则该实例客观下线。quorum值最好超过sentinel实例数量的一半

哨兵选主规则

首先判断主与从节点断开时间长短，如超过指定值就排除该从节点。
然后判断从节点的slave-priority值，越小优先级越高
如果slave-priority一样，则判断slave节点的offset值，越大优先级越高。
最后是判断slave节点的运行id大小，越小优先级越高

redis集群（哨兵模式）脑裂

同一个 Redis 集群中，原主节点还在对外提供服务，而哨兵却因网络原因误判其“宕机”，选出了新的主节点，导致同时存在两个主节点，造成数据不一致、写入丢失等问题。

解决方式：

设置 min-slaves-to-write + min-slaves-max-lag

min-slaves-to-write 1
min-slaves-max-lag 10

让主节点感知自己已孤立时自动拒绝写入，避免成为“孤岛主”。
如果主节点无法感知至少一个从节点 10 秒内正常响应，就拒绝写入；

分片集群

分片集群特征

集群有多个master，每个master保存不同数据
每个master都可以有多个slave节点
master之间通过ping监测彼此健康状态
客户端请求可以访问集群任意节点，最终都会被转发到正确节点

数据读写

Redis分片集群引入了哈希槽的概念，Redis集群有16384个哈希槽，每个key通过CRC16校验后对16384取模来决定放置哪个槽，集群的每个节点负责一部分hash槽。

读写数据：根据key的有效部分计算哈希值，对16384取余（有效部分，如果key前面有大括号，大括号的内容就是有效部分，如果没有，则以key本身作为有效部分）余数为插槽，寻找插槽所在实例

Redis是单线程的，但是为什么还那么快

完全基于内存操作

所有数据都在内存中，避免了磁盘 I/O 的高延迟；
访问速度可达微秒级；

使用高性能的 I/O 多路复用机制

底层采用 epoll（Linux）+ 自定义事件循环，单线程也能处理高并发连接；
没有线程上下文切换的开销；

I/O 多路复用允许一个线程通过内核提供的接口，如 select、poll、epoll，同时监听多个 socket，当其中某个就绪后再处理，避免阻塞等待，极大提升了并发处理能力。目前的IO多路复用都是采用的epoll模式实现，它会在通知用户进程Socket就绪的同时，把已就绪的Socket写入用户空间，不需要挨个遍历Socket来判断是否就绪，提升了性能。Redis 就是基于 epoll 实现的高效事件驱动模型。

模型	是否阻塞	性能	特点
`select`	是	最差	最多支持 1024 个连接，效率低
`poll`	是	一般	支持更多连接，但每次都遍历全部 FD
`epoll`	否（事件驱动）	最佳（Linux）	支持大量连接，效率高，Redis/NGINX 用它