当前位置：首页 > news >正文

《亿级流量系统架构设计与实战》通用高并发架构设计读场景

news 2025/8/31 20:11:30

高并发架构设计的要点

场景分类

读多写少、写多读少，读多写多

高并发读场景方案1：数据库读/写分离

数据库承受的高并发请求压力，主要来自读请求。我们可以把数据库按照读/写请求分成专门负责处理写请求的数据库（写库）和专门负责处理读请求的数据库（读库），让所有的写请求都落到写库，写库将写请求处理后的最新数据同步到读库，所有的读请求都从读库中读取数据。这就是数据库读/写分离的思路。

数据库读/写分离使大量的读请求从数据库中分离出来，减少了数据库访问压力，缩短了请求响应时间。

架构

用数据库主从复制，将主节点Master作为 “写库”，将从节点Slave作为“读库”，一个Master与多个Slave连接。

请求路由方式

写请求交给Master处理，而把读请求交给Slave处理, 那么由什么角色来执行这样的读/写请求路由呢？一般可以采用如下两种方式。

基于数据库Proxy代理的方式

在业务服务和数据库服务器之间增加数据库Proxy代理节点，业务服务对数据库的一切操作都需要经过Proxy转发。Proxy收到业务服务的数据库操作请求后，根据请求中的SQL语句进行归类，将属于写操作的请求（如insert/delete/update语句）转发到数据库Master,将属于读操作的请求（如select语句）转发到数据库任意一个Slave, 完成读/写分离的路由。开源项目如中心化代理形式的MySQL-Proxy和MyCat,以及本地代理形式的MySQL-Router等都实现了读/写分离功能。

基于应用内嵌的方式

基于应用内嵌的方式与基于数据库Proxy代理的方式的主要区别是，它在业务服务进程内进行请求读/写分离，数据库连接框架开源项目如gorm、shardingjdbc等都实现了此形式的读/写分离功能。

主从延迟与解决方案

数据库读/写分离架构依赖数据库主从复制技术，而数据库主从复制存在数据复制延迟（主从延迟），因此会导致在数据复制延迟期间主从数据的不一致，Slave获取不到最新数据。针对主从延迟问题有如下三种解决方案。

同步数据复制

数据库主从复制默认是异步模式，Master在写完数据后就返回成功了，而不管Slave 是否收到此数据。我们可以将主从复制配置为同步模式，Master在写完数据后，要等到全部Slave都收到此数据后才返回成功。

这种方案可以保证每次写操作成功后，Master和Slave都能读取到最新数据。

但是由于在处理业务写请求时,Master要等到全部Slave都收到数据后才能返回成功，写请求的延迟将大大增加，数据库的吞吐量也会有明显的下滑。

强制读主

取决于具体业务场景

用户a刚刚发布了一条状态，他浏览个人主页时应该展示这条状态，这个场景不太能容忍主从延迟；而好友用户b此时浏览用户a的个人主页时，可以暂时看不到用户a最新发布的状态，这个场景可以容忍主从延迟。我们可以对业务场景按照主从延迟容忍性的高低进行划分，对于主从延迟容忍性高的场景，执行正常的读/写分离逻辑；而对于主从延迟容忍性低的场景，强制将读请求路由到数据库Master,即强制读主。

会话分离

比如某会话在数据库中执行了写操作，那么在接下来极短的一段时间内，此会话的读请求暂时被强制路由到数据库Master,与“强制读主”方案中的例子很像，保证每个用户的写操作立刻对自己可见。暂时强制读主的时间可以被设定为略高于数据库完成主从数据复制的延迟时间，尽量使强制读主的时间段覆盖主从数据复制的实际延迟时间。

高并发读场景方案2：本地缓存

基本的缓存淘汰策略

FIFO（First In First Out）：优先淘汰最早进入缓存的数据。可以通过队列实现，缓存命中率低。
LFU（Least Frequently Used）：优先淘汰最不常用的数据。为每条缓存数据维护一个访问计数，数据每被访问一次，其访问计数就加1，会淘汰计数最小的数据。适合缓存在短时间内会被频繁访问的热点数据，但是最近最新缓存的数据总会被淘汰，而早期访问频率高但最近一直未被访问的数据会长期占用缓存。
LRU（Least Recent Used）：优先淘汰缓存中最近最少使用的数据。一般基于双向链表和哈希表配合实现。

java中就是LinkedHashMap了

将最近被访问的数据放置在尾部，使缓存数据在双向链表中按照最近访问时间由远及近排序，每次被淘汰的都是位于双向链表头部的数据。

LRU策略和LFU策略的缺点是都会导致缓存命中率大幅下降。

W-TinyLFU策略

W-TinyLFU策略结合了 LFU策略和LRU策略的优点，兼具高缓存命中率与低内存占用，Redis和高性能的Java本地缓存Caffeine Cache组件都使用W-TinyLFU策略管理缓存。

W-TinyLFU将缓存的内存空间划分为两部分：

Window LRU段：此内存段使用LRU策略缓存数据，其占用的内存空间是总缓存内存空间的1%。
Segment LRU段：此内存段使用SLRU策略缓存数据，具体是将缓存段进一步划分为protected段（保护段）和probation段（试用段）,其中probation段负责存储最近被访问1次的缓存数据，protected段负责存储最近被访问至少2次的缓存数据。Segment LRU段内存空间的80%被分配给protected段，剩余20%的内存空间被分配给 probation 段。

工作流程：

将首次被访问的数据X缓存到Window LRU段。
当Window LRU段的内存空间已满时，使用LRU策略将被淘汰的数据移入 Segment LRU段中的probation段，之后数据X被访问时，再将其移入protected段。
当protected段的内存空间已满时，使用LRU策略将被淘汰的数据X移入 probation 段。
当数据X要被移入probation段，但是其内存空间已满时，使用LRU策略将被淘汰的数据V取出，与数据X进行访问频率的对比，将访问频率高的数据留在proation段，将访问频率低的数据淘汰。

W-TinyLFU策略使用Count-Min Sketch近似算法来保存每条缓存数据的访问频率

Count-Min Sketch算法的运行流程：

选定M个哈希函数，分配一个M行N列的二维数组作为哈希表。
当某数据的访问频率增加时，对数据Key分别使用M个哈希函数计算出哈希值, 再对N取模，然后将二维数组每一行对应的列位置的数值加1,即二维数组中M个位置的数值均被更新。
当查询某数据的访问频率时，进行同样的哈希计算，将二维数组中M个位置的数值读出，选择其中的最小值作为此数据的访问频率。

此策略认为每条数据的访问频率达到15次就已经很高了，于是以4bit表示每条缓存数据的访问频率，最大值为15（2^4 - 1）

如果直接存访问次数，需要4/8字节（32/64）位操作系统

不过，如果大量数据均达到15次的访问频率，那么就会使得访问频率的区分度大大降低。 W-TinyLFU策略采用基于滑动窗口的时间衰减设计机制来解决这个问题:此策略单独维护一个全局计数，每当二维数组更新1次时，此全局计数就加1;当全局计数达到某个阈值时，将二维数组中的全部访问频率除以2,同时将全局计数除以2。