当前位置: 首页 > web >正文

【Redis】哈希表结构

目录

  • 1、背景
  • 2、哈希表
    • 【1】底层结构
    • 【2】哈希冲突
    • 【3】链地址法
    • 【4】传统rehash
    • 【5】渐进式rehash
    • 【6】rehash触发条件
    • 【7】特性

1、背景

redis中的hashtable(哈希表)是一种高效的键值对存储结构,主要用于实现redis的字典类型,接下来就来讲解一下hashtable(redis版本6.2.18)的底层实现。

2、哈希表

【1】底层结构

hashtable主要包含以下结构体,dict-字典结构:

typedef struct dict {dictType *type; //类型特定函数void *privdata; //私有数据dictht ht[2]; //哈希表数组(两个,用于rehash)long rehashidx; //rehash索引,-1表示不在rehashint16_t pauserehash; //如果>0代表rehash暂停(<0表示编码错误)
} dict;

dictht-哈希表结构:

typedef struct dictht {dictEntry **table; //哈希表数组unsigned long size; //哈希表大小unsigned long sizemask; //哈希表大小掩码,用于计算索引值 unsigned long used; //哈希表已有节点数量
} dictht;

dictEntry-哈希表节点,头节点叫哈希桶:

typedef struct dictEntry {void *key; //键union {void *val;uint64_t u64;int64_t s64;double d;} v; //值struct dictEntry *next; //指向下个哈希表节点,形成链表
} dictEntry;

【2】哈希冲突

在redis的hashtable实现中,哈希冲突发生在两个或多个不同的键(key)被哈希函数映射到同一个哈希桶(bucket)的情况。这种情况是不可避免的,因为:

1、哈希函数的输出空间(哈希值范围)通常小于输入空间(可能的键数量)
2、即使有完美的哈希函数,在实际应用中内存也是有限的

【3】链地址法

redis采用链地址法来处理哈希冲突,链地址法的实现如下:

1、每个哈希桶实际上是一个单向链表的头指针
2、当发生冲突时,新的键值对会被添加到对应桶的链表中
3、查找时需要遍历链表来找到匹配的键

冲突处理流程如下分为三类,插入操作流程如下:

<1>插入操作流程

1、计算键的哈希值
2、通过哈希值确定桶位置
3、将新节点插入到链表头部(时间复杂度O(1)

<2>查找操作流程

1、计算键的哈希值
2、定位到对应的桶
3、遍历链表查找匹配的键

<3>删除操作流程

1、类似查找过程,找到节点后从链表中移除

【4】传统rehash

链地址法虽然能解决hash冲突,但是当链表越来越长的时候,查询速度也会越来越慢了,毕竟查询时间复杂度为O(n)。所以就需要rehash,rehash是哈希表在扩容或缩容时重新分配所有键值对到新哈希表的过程。传统的一次性rehash方式会一次性将所有键值对从旧表迁移到新表,这会导致:

1、内存占用翻倍(需要同时维护新旧两个表)
2、迁移过程可能阻塞服务(对于大哈希表)
3、响应时间不稳定

【5】渐进式rehash

redis采用渐进式rehash来解决传统rehash问题,核心思想是将rehash过程分摊到多个操作中完成,渐进式rehash的实现机制如下:

<1>使用双表结构:

typedef struct dict {dictht ht[2]; //两个哈希表,ht[0]是主表,h[1]是rehash目标表long rehashidx; //rehash进度索引,-1表示未进行rehash
} dict;

<2>触发条件满足时:

1、分配新的哈希表ht[1]
2、设置rehashidx = 0,开始rehash过程

<3>逐步迁移:

1、每次对字典的增删改查操作时,除了执行指定操作外,还会将ht[0]的rehashidx位置上的所有键值对迁移到ht[1]
2、迁移完成后rehashidx++

<4>完成条件:

1、当ht[0]的所有键值对都迁移到ht[1]2、释放ht[0],将ht[1]设置为新的ht[0]
3、重置rehashidx = -1

渐进性rehash的访问逻辑如下:

<1>查找操作:

1、现在h[0]查找
2、如果没找到且正在rehash,再到ht[1]查找

<2>插入操作:

1、新键值对只插入到ht[1]
2、保证ht[0]只减不增

<3>删除/更新操作

1、同时在两个表中操作

【6】rehash触发条件

redis的哈希表在以下两种情况会触发rehash:

1、扩容条件:当负载因子(哈希表已使用的节点数量/哈希表大小)> 1时,且服务器没有执行RDB快照或AOF重写
2、缩容条件:负载因子 < 0.1时

【7】特性

hashtable的特性如下:

特性说明
数据结构采用链式哈希表(数组 + 链表结构)
冲突解决链地址法
哈希函数针对不同键类型(字符串、整数等)使用优化后的哈希算法
动态扩容负载因子 > 1且没执行RDB和AOF
渐进式rehash扩容/缩容时逐步迁移数据,避免阻塞服务
双哈希表维护ht[0](主表)和ht[1](rehash目标表)
缩容机制负载因子 < 0.1
内存效率通过渐进式rehash减少内存峰值占用
线程安全依赖redis单线程模型保证原子性操作
时间复杂度平均O(1)查找/插入/删除(理想情况)
多态支持通过dictType结构支持不同数据类型的键值操作
http://www.xdnf.cn/news/7787.html

相关文章:

  • Baklib构建AI就绪型知识中台实践
  • 内网穿透:轻松实现外网访问本地服务
  • 至此(day1-day4)代码详解(ai辅助整理)
  • IEEEtran中文献中的作者大于3个时,用et al.省略
  • 院校机试刷题第八天:B3846闰年求和、P1012字母异位词分组
  • 使用亮数据代理IP+Python爬虫批量爬取招聘信息训练面试类AI智能体(手把手教学版)
  • 算法第24天|93.复原IP地址、 78.子集、 90.子集II
  • Java 10IO流
  • DockerHub被封禁,怎么将镜像传到国内?一种简单合规的镜像同步到国内方案[最佳实践]
  • KLEC--基于知识学习的演化计算算法
  • 硬盘健康检测与性能测试的实践指南
  • 【AI助手】提升开发效率:Continue配置自定义提示词模板及规则
  • 白皮精读:109页数据资源体系构建白皮书【附全文阅读】
  • 汉语词汇的神奇拼图:关联性的魅力
  • AI大模型应对挑战,使用winform实现小球在旋转五边形内的舞蹈
  • Java数组列表 - ArrayList
  • 如何使用VH6501进行CAN采样点测试
  • Portal认证和802.1x的区别
  • 机器学习入门
  • 理解Java泛型
  • 直流无刷水泵方案之无感FOC控制---【其利天下技术】
  • StreamSaver实现大文件下载解决方案
  • 对象属性复制BeanCopier-笔记
  • 基于正点原子阿波罗F429开发板的LWIP应用(2)——设置静态IP和MAC地址修改
  • Python代码加密与发布方案详解
  • SpringMVC04所有注解按照使用位置划分| 按照使用层级划分(业务层、视图层、控制层)
  • MCP模型上下文协议:基于FastMCP 2.0的实践(2)
  • 机器学习第十九讲:交叉验证 → 用五次模拟考试验证真实水平
  • Linux基础IO(二)
  • upload-labs通关笔记-第14关 文件上传之文件头绕过(图片马)