当前位置: 首页 > news >正文

Redis分布式缓存(RDB、AOF、主从同步)

文章目录

    • 1. Redis持久化
      • 1.1 RDB快照
      • 1.2 AOF日志
        • 1.2.1 AOF的三种回写策略:
        • 1.2.2 AOF重写机制
      • 1.3 RDB和AOF对比
      • 1.4 混合持久化
    • 2.Redis主从复制
      • 2.1第一次同步
      • 2.2 命令传播
      • 2.3 增量复制

在这里插入图片描述
我们分布式缓存就是要解决这四个问题。

1. Redis持久化

实现Redis数据持久化有三种方式

  • RDB快照:将数据写入磁盘
  • AOF日志:将命令追加到文件里
  • 混合持久化:混合RDB和AOF的优点

1.1 RDB快照

RDB快照又叫做Redis数据快照,简单来说就是,将数据记录到磁盘中,当Redis发生故障重启后,可以根据快照文件进行数据回复。

由于RDB保存的是全部数据,手动保存所需时间可能比较久,会阻塞线程。因此我们通常使用bgsave即创建一个子线程去进行数据备份。

# 900秒内,如果至少有1个key被修改,则执行bgsave , 如果是save "" 则表示禁用RDB
save 900 1  
save 300 10  
save 60 10000 

RDB在执行快照时,数据能修改吗?

可以,RDB中bgsave采用的是Write-on-Copy技术,主线程会fork一个子线程并复制主线程的页表,当主线程进行读操作时,会根据页表的映射关系读取到磁盘中的数据。当主进程执行写操作时,会创建一个数据副本,子进程会把数据副本也写入磁盘。
在这里插入图片描述
小结:
RDB方式bgsave的基本流程?

  • fork主进程得到一个子进程,共享内存空间
  • 子进程读取内存数据并异步写入新的RDB文件
  • 用新RDB文件替换旧的RDB文件

RDB会在什么时候执行?save 60 1000代表什么含义?

  • 默认是服务停止时
  • 执行save和bgsave
  • 代表60秒内至少执行1000次修改则触发RDB

RDB的缺点?

  • RDB执行间隔时间长,两次RDB之间写入数据有丢失的风险
  • fork子进程、压缩、写出RDB文件都比较耗时

1.2 AOF日志

AOF日志是Redis在执行完命令后会把每一个命令都追加到一个文件里,当Redis重启后,可以根据文件里面的命令进行数据的恢复。
在这里插入图片描述

1.2.1 AOF的三种回写策略:
  • Always:即每执行一个命令就将该命令写入AOF文件
  • Everysce:每执行完一个命令,将该命令存入缓冲区,每隔1秒就将缓冲区里的命令一起写入AOF文件
  • No:每执行完一个命令,将该命令存入缓冲区,再由操作系统决定何时将命令写入AOF文件
    在这里插入图片描述
1.2.2 AOF重写机制

当AOF文件过大时会触发重写机制,简单来说就是会读取数据库中的键值对数据,然后将每个键值对用一条命令记录到AOF文件中,将重复的命令合成为一个命令,全部完成后,再将新的AOF文件替换掉旧的AOF文件,比如
在这里插入图片描述
原本是三个命令,修改了两次num但是实际起作用的只有最后一次修改,并且由于两次执行的都是set操作,因此可以合并为mset。

重写的过程:主进程创建重写AOF的子进程,父子进程共享物理内存,重写子进程对这个内存为只读,重写子进程会读取数据库里的所有键值对,将每个键值对转化为一条命令。再将命令记录到重写日志(新的AOF日志)
与此同时==主进程依然可以进行正常命令处理。但是这时有个新问题:如果主进程进行了key-value的修改,那主进程和子进程的内存数据不一样了怎么办?
这里Redis设置了
AOF重写缓冲区==,当Redis执行完一个命令后,它会同时将这个命令写入[AOF缓冲区]和[AOF重写缓冲区]
在这里插入图片描述
当子进程执行完重写操作后,会向主进程发送一条信号,主进程收到信号后会调用信号处理函数,作用是:将AOF重写缓冲区的所有内容追加到新的AOF文件中,将新的AOF文件覆盖现在的AOF文件

1.3 RDB和AOF对比

在这里插入图片描述

1.4 混合持久化

即结合了RDB与AOF的优点:AOF前半部分是RDB格式的全量数据,后半部分是AOF格式。
缺点:可读性差,兼容性差。

2.Redis主从复制

如果我们将数据只存到一个Redis服务器当中,如果该Redis宕机,就会造成严重后果。因此我们将数据存到多个服务器中,其中把数据同步到其他服务器采用的就是Redis主从复制。

2.1第一次同步

主从服务器的第一次同步可以分为三个阶段:

  • 第一阶段是建立连接、协商同步
  • 第二阶段是主服务器同步数据给从服务器
  • 第三阶段主服务器发送新写操作命令给从服务器
    在这里插入图片描述
    第一阶段:建立连接,协商同步
    当执行replicaof命令之后,从服务器向主服务器发送psync命令,表示要进行数据同步。里面包含两个参数
  • runID:每个服务器启动时会自动创建一个随机的runID,它可以用来与主服务器的runID进行比较,判断是否相同,如果相同说明不是第一次进行数据同步了,要进行增量同步。如果不同说明是第一次同步,要进行增量同步。
  • offset:用来标记复制的进度
    接收到命令后主服务器会返回FULLRESYNC命令(执行全量同步),里面包含主服务器的runID,offset
    第二阶段:主服务器同步数据给从服务器
    主服务器会执行bgsave命令生成RDB文件,并发送给从服务器,从服务器收到后会先清空当前数据,然后再载入RDB文件。
    此时主服务器依然可以正常执行命令,但是这期间进行的操作并没有记录到RDB文件中,怎么保持主从数据的一致呢?
    为了保持主从数据的一致性,主服务器将在下面三个时间间隔里进行的写操作记录到replication buffer缓冲区中
  • 主服务器生成RDB文件期间
  • 主服务器发送RDB文件期间
  • 从服务器加载RDB文件期间
    第三阶段:主服务器发送新的写操作给从服务器
    在从服务器将RDB文件载入后,会发送一个确认消息给主服务器,接着主服务器会把relication buffer缓冲区里的写操作命令发送给从服务器,从服务器开始执行来自主服务器的写操作命令。至此第一次同步结束,两者的数据一致。

2.2 命令传播

主从服务器第一次同步后双方就会简历一个TCP连接,后续的写操作可以通过这个连接来将命令传播给从服务器

2.3 增量复制

当主从服务器之间的连接断开后再次重新连接,同步数据的过程叫增量复制
在这里插入图片描述
这里也主要有三个步骤

  • 从服务器向主服务器发送psync命令
  • 主服务器收到命令判断runID一致后返回CONTINUE命令告诉从服务器使用增量同步的方式
  • 主服务器将断开期间主服务器执行的写命令发送给从服务器,从服务器再执行
    其中
    repl_backlog_buffer,和offset起到关键作用
    repl_backlog_buffer:环形缓冲区,用于主从服务器断开连接后从中找到差异的数据
    offset:标记缓冲区的进度,从服务器的offset标记自己到哪了,主服务器标记自己在哪里。
    那repl_backlog_buffer里的内容是什么时候写入的呢?

在主服务器进行命令传播时,也会将命令存入repl_backlog_buffer,因此这个缓冲区里存放着最近的命令。
在这里插入图片描述
主服务器和从服务器之间的差,就是增量同步的数据
在这里插入图片描述
但是如果,主从服务器之间差的太多,已经将从服务器未同步的数据覆盖掉了,那接下来将使用全量同步的方式。
在这里插入图片描述

http://www.xdnf.cn/news/988039.html

相关文章:

  • force命令的使用
  • 图文教程——Deepseek最强平替工具免费申请教程——国内edu邮箱可用
  • 传统Web应用和RESTful API模式
  • javaee初阶-多线程
  • C++基础
  • Oracle集群OCR磁盘组掉盘问题处理
  • echart pie label.rich 颜色设置与项目同色
  • matlab红外与可见光图像配准算法
  • Flask 报错修复实战:send_file() got an unexpected keyword argument ‘etag‘
  • 什么是Power Distribution Unit(PDU)以及智能PDU:应用的演变历程
  • C#简单线程启动的几种方法总结
  • Windows平台网络通信
  • SQL Server 查询数据库中所有表中所有字段的数据类型及长度
  • 从“字对字“到“意对意“:AI翻译正在重塑人类的语言认知模式
  • 从代码学习深度学习 - 全局向量的词嵌入(GloVe)PyTorch版
  • 医疗行业双碳战略升维:从合规达标到价值创造的转型路径
  • JavaWeb(JavaBean预习)
  • 智慧园区智能化整体解决方案
  • c#实现绝对路径和相对路径的转换
  • 黑马python(四)
  • CentOS Stream 9——RustDesk基础版自建教程(Docker)
  • <script> 标签的 async 与 defer 属性详解
  • 《Linux C编程实战》笔记番外:如何避免子进程成为僵尸进程
  • 阿里云unbantu、Flask部署模型的一个错误
  • 安卓+苹果端签名教程
  • SiteAzure:文章删除后,前台还能搜索到
  • HarmonyOS - UIObserver(无感监听)
  • TF-IDF算法的代码实践应用——关键词提取、文本分类、信息检索
  • 帆软 BI 从入门到实战全攻略(一):安装激活与添加数据
  • 大量RPM仓库管理指南:更新与批量获取实战手册