当前位置: 首页 > news >正文

分布式 ID 生成的五种方法:优缺点与适用场景

0.简介

在分布式系统中,生成全局唯一的id是一个常见的需求。由于分布式系统的特性(多节点,网络分区,时钟不同步等),传统的单机ID生成方式不再适用,所以一些分布式生成方式应运而生,本文将对常见的几种分布式ID生成方法的原理和应用进行介绍。

1.分布式ID的生成要求

分布式ID的生成一般要满足以下要求:
1)全局唯一:生成的 ID 必须在整个系统中唯一。
2)高性能:ID 生成的速度要快,不能成为系统的瓶颈。
3)高可用:ID 生成服务必须高可用,不能因为单点故障导致系统不可用。
4)趋势递增:生成的 ID 最好具有递增趋势,便于数据库索引和排序。

2.数据库自增方式

数据库的自增方式生成分布式ID就是使用数据库的自增列来实现,其优缺点如下:
优点:
1)使用简单,直接使用数据库已有的自增功能;

2)能够保证唯一性和递增性;

缺点:

1)性能瓶颈,在高并发场景下,数据库可能成为性能瓶颈;

2)可用性问题,存在单点故障可能;

使用场景:主要适用小规模分布式系统,对性能要求不高的场景。

在这里插入图片描述

改进方式:
1)冗余主节点,避免单点写入。
在这里插入图片描述

2)批量生成id,降低读写频率。其不需要挨个获取,一次获取多个同时更新max-id,下次就继续在max-id增加。
在这里插入图片描述

3.UUID

UUID(Universally Unique Identifier)是一个 128 位的全局唯一标识符,通常表示为 32 个十六进制字符,例如:

550e8400-e29b-41d4-a716-446655440000

优点:
1)简单易用:无需中心化服务,每个节点都可以独立生成 UUID。
2)全局唯一:UUID 的生成基于时间戳、随机数和 MAC 地址,几乎不可能重复。
3)性能个扩展性好:本地生成,没有扩展和性能瓶颈。
缺点:
1)长度较长:128 位的 UUID 存储和传输以及查询开销较大,可以拆成两个uint64整数存储。
2)无序性:UUID 是随机生成的,不具备递增趋势,不利于数据库索引。
适用场景:对ID长度以及有序性要求不高的场景。
改进方式:
1)可以增加时间信息,如在开头增加毫秒数,优点就是能保证递增;缺点就是可能在同一时间的话可能会出现冲突。

4.Snowflake算法

4.1 原理

Snowflake 是 Twitter 开源的分布式 ID 生成算法,生成的 ID 是一个 64 位的整数,结构如下:

1 bit41 bits10 bits12 bits
signtimestampmachine IDsequence

sign:符号位,固定为 0。

timestamp:41 位的时间戳,表示从某个起始时间到当前时间的毫秒数。

machine ID:10 位的机器 ID,用于区分不同的节点。

sequence:12 位的序列号,用于同一毫秒内生成多个 ID。
优点:

1)高性能:本地生成 ID,无需网络通信。

2)趋势递增:ID 按时间戳递增,便于数据库索引。

3)高可用:无中心化服务,每个节点独立生成 ID。
缺点:

1)时钟回拨问题:如果系统时钟回拨,可能导致 ID 重复。

2)机器 ID 分配:需要手动或通过外部服务分配机器 ID。
适用场景:大规模分布式系统,对性能和有序性要求较高的场景。

改进方式:可以通过等待时间同步解决时钟回拨,通过扩展时间位来解决时间一出,通过动态机器id分配解决手动分配问题。

5.Redis自增ID

该方法是利用 Redis 的原子操作 INCR 或 INCRBY 生成全局唯一的 ID。

使用 Redis 的 INCR 命令生成自增 ID:

INCR id_generator

如果需要生成更长的 ID,可以使用

INCRBY id_generator 1000

优点:
1)高性能:Redis 的 INCR 操作是原子性的,性能较高。
2)简单易用:实现简单,无需复杂的算法。

缺点:
1)依赖 Redis:需要维护 Redis 服务,存在单点故障风险。

2)ID 长度有限:Redis 的 INCR 生成的 ID 是 64 位整数,可能不够用。

适用场景:中小规模分布式系统,对性能和有序性有一定要求的场景。
改进方式:可以参考数据库自增id方式优化。

6.Leaf算法

Leaf 是美团开源的分布式 ID 生成服务,结合了数据库和 Snowflake 算法的优点。它支持两种模式:

1)号段模式:从数据库批量获取 ID 段,缓存在本地。

2)Snowflake 模式:基于 Snowflake 算法生成 ID。

优点:
1)高性能:号段模式减少了数据库访问次数,Snowflake 模式本地生成 ID。

2)高可用:支持多节点部署,无单点故障。

3)灵活配置:支持号段模式和 Snowflake 模式切换。

缺点:
1)复杂度较高:需要部署和维护 Leaf 服务。

适用场景:大规模分布式系统,对性能和可用性要求较高的场景。
分布式id生成的五种方法

http://www.xdnf.cn/news/487243.html

相关文章:

  • Windows系统功能管控指南 | 一键隐藏关机键/禁用任务管理器
  • LLM学习笔记(五)概率论
  • 深入剖析Spring Boot参数校验:实现原理、自定义注解组件与国际化多语言实践
  • SEO长尾关键词优化策略解析
  • 基于vue框架的订单管理系统r3771(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • Solon Ai Flow 编排开发框架发布预告(效果预览)
  • CSS:三大特性
  • C++性能测试工具——Vtune等的介绍
  • 嵌入式项目生命周期模型-瀑布模型
  • 嵌入式开发书籍推荐
  • SpringMVC 内容协商处理
  • python训练 60天挑战-day27
  • 【知识点】语义分割任务中有哪些损失函数?
  • 操作系统-锁/内存/中断/IO
  • 机器学习前言2
  • 如何在windows server 2022 上安装WSL
  • Seata源码—4.全局事务拦截与开启事务处理一
  • 三格电子上新了——Modbus转IEC104网关
  • mybatisPlus 新增时 其他字段的值和 id 保持一致实现方法
  • NexBot AI 1.9.3 | 专业AI写作助手,高自由度定制内容,支持中文设置
  • Java 线程状态详解:从创建到销毁的完整旅途
  • 深度学习驱动下的目标检测技术:原理、算法与应用创新
  • PT2031S单触控单输出触摸IC
  • 关闭VSCode 自动更新
  • foxmail - foxmail 启用超大附件提示密码与帐号不匹配
  • 内部检测实验室数字化转型新路径 质检LIMS系统如何实现合规、效率、资质三重突破?
  • FC7300 SPI MCAL配置引导
  • Python爬虫(28)Python爬虫高阶:Selenium+Splash双引擎渲染实战与性能优化
  • Go语言交替打印问题及多种实现方法
  • 黑马点评面试前复习