当前位置: 首页 > ai >正文

HashMap的长度为什么要是2的n次幂以及HashMap的继承关系(元码解析)

我们通过HashMap可以得知

  • Cloneable 空接口,表示可以克隆。创建并返回HashMap对象的一个副本。

  • Serializable 序列化接口。属于标记性接口。HashMap对象可以被序列化和反序列化

  • Abstract Map 父类提供了Map实现接口。以最大限度地减少实现此接口所需的工作。

我们实际上可以发现一个问题也就是HashMap本事就有实现一个Map接口,但是继承的父类里面还是实现着一个Map接口,为什么要这样?

实际上这是一个官方的小错误JAVA集合框架的创始人Josh Bloch描述这样的写法是一个失误,在java集合框架中,类似的写法也有很多,在设计之初,他认为这样写在某些地方可能是有价值的,知道他意识到并没有,显然JDK的维护者, Oracle 公司后来认为这样小小的错误不值得去修改,所以就这样保存了下来。

HashMap集合类的成员

1.序列化版本号,HashMap实现这个接口的时候自带的一个默认版本号。

private static final long serialVersionUID = 362498820763181265L;

2.为什么数组的长度(2^N)

默认的初始化容量是16。

数组长度设计为2的n次幂的主要原因是什么?

HashMap(int initialcapacity)构造一个带指定初始容量和默认加载因子(0.75)的空 Hashap。

我们通过底层可以得知,在向HashMap进行添加元素的时候,根绝key的hash值去确定在数组中的具体位置,HashMap为了存取的高效,要尽量避免减少哈希碰撞,每个链表的长度大致相同,为了实现这一功能,算法采用了取模hash%length,但是计算机中直接求余效率不如进行位移运算,所以源码中使用了hash&(length-1),而hash%length=hash&(length-1)的前提就是length是2的n幂。

我们来进行验证,我们取哈希值为2和3进行运算,下面是我们通过length为2的n次幂来计算没有出现哈希碰撞。

hash=3 & (8-1)
步骤1: 转换为二进制
hash = 3    →  0000 0011
length-1 =7 →  0000 0111
​
步骤2: 按位与运算0000 0011  (3)
& 0000 0111  (7)
-----------0000 0011  (3) → 最终索引为3hash=2 & (8-1)
步骤1: 转换为二进制
hash = 2    →  0000 0010
length-1 =7 →  0000 0111
​
步骤2: 按位与运算0000 0010  (2)
& 0000 0111  (7)
-----------0000 0010  (2) → 最终索引为2

当我们不按照这样来进行运算,我们将length变成9

hash=3 & (9-1)
步骤 1: 转换为二进制
hash = 3 → 0000 0011
length-1 =8 → 0000 1000
​
步骤 2: 按位与运算0000 0011 (3)
& 0000 1000 (8)
-------------------0000 0000 (0) → 最终索引为 0
​
hash=2 & (9-1)
步骤 1: 转换为二进制
hash = 2 → 0000 0010
length-1 =8 → 0000 1000
​
步骤 2: 按位与运算0000 0010 (2)
& 0000 1000 (8)
----------------0000 0000 (0) → 最终索引为 0

上面两个例子我们可以看的出来如果数组的长度不是2的n次幂,那么就容易出现哈希碰撞。本质是:当数组长度为 2 的幂时,hash & (length - 1) 能让哈希值低位充分参与运算,索引分布更均匀,减少冲突;若长度非 2 的幂,length - 1 二进制含无效高位 0,会压缩索引范围,增大冲突概率,这也是哈希表(如 HashMap )设计中优先选 2 的幂为数组长度的核心原因 。

注意:如果不考虑效率的话,那么长度就可以随便设置了。

http://www.xdnf.cn/news/15340.html

相关文章:

  • 持续优化小程序排名,稳定获取搜索流量
  • Bash常见条件语句和循环语句
  • gRPC和http长轮询
  • Python:打造你的HTTP应用帝国
  • 019_工具集成与外部API调用
  • 缺乏实际里程碑管控项目进度,如何设定关键节点
  • 李沐动手学深度学习Pytorch-v2笔记【08线性回归+基础优化算法】2
  • PHP password_hash() 函数
  • Excel常用快捷键与功能整理
  • 当 `conda list` 里出现两个 pip:一步步拆解并卸载冲突包
  • 【时时三省】(C语言基础)用数组名作函数参数
  • MFC中BOOL类型,在某些操作系统中,-1不能被识别,一般是哪些原因?
  • C++-linux 7.文件IO(二)文件描述符、阻塞与非阻塞
  • 招投标——环保大数据平台售后服务计划
  • 现代数据平台能力地图:如何构建未来数据平台的核心能力体系
  • Spark 之 like 表达式
  • uni-app开发的页面跳转全局加载中
  • QT——信号与槽
  • git 访问 github
  • 《恋与深空》中黑白羽毛是谁的代表物?
  • python+Request提取cookie
  • ubuntu22.04下配置qt5.15.17开发环境
  • Elasticsearch9.x核心架构概述
  • 机器学习、深度学习、神经网络之间的关系
  • 多租户云环境下的隔离性保障:虚拟化、容器、安全组如何协同防护?
  • 高德开放平台携手阿里云,面向开发者推出地图服务产品MCP Server
  • Redis技术笔记-主从复制、哨兵与持久化实战指南
  • 工业场合需要千变万化的模拟信号,如何获取?
  • Servlet基础
  • priority_queue的使用和模拟实现以及仿函数