当前位置: 首页 > news >正文

电商项目_核心业务_分布式ID服务

分布式ID有哪些要求

  1. 全局唯一性:不能出现重复的 ID 号,既然是唯一标识,这是最基本的要求。
  2. 趋势递增、单调递增:保证下一个 ID 一定大于上一个ID。(索引是基于B+数,非递增的主键在构建索引时容易引起B+数的裂变)
  3. 信息安全:如果ID的规则非常明显(如果 ID 是连续的),容易被恶意爬取数据。如果是订单号,竞对可以直接知道我们一天的单量。
  4. 对生成ID的性能要求极高,一个ID 生成系统还需要做到平均延迟和 TP999 延迟都要尽可能低;可用性 5 个9;高 QPS。

分布式ID生成方式

 UUID

        UUID(Universally Unique Identifier)的标准型式包含 32 个16 进制数字(128位, 16个字节),以连字号分为五段,形式为 8-4-4-4-12 的36 个字符,示例:

550e8400-e29b-41d4-a716-446655440000。

优点:

        性能非常高:本地生成,没有网络消耗。

缺点:

  1. 不易于存储:UUID 太长,16 字节128 位,通常以36 长度的字符串表示,很多场景不适用。
  2. 信息不安全:基于 MAC 地址生成UUID 的算法可能会造成 MAC 地址泄露,这个漏洞曾被用于寻找梅丽莎病毒的制作者位置。
  3. 不适合作为DB主键
    1. MySQL 官方有明确的建议主键要尽量越短越好

    2. 对MySQL 索引不利:如果作为数据库主键,在 InnoDB 引擎下,UUID 的无序性可能会引起数据位置频繁变动,严重影响性能。

生成UUID方式:

 public static void main(String[] args) {String rawUUID = UUID.randomUUID().toString();System.out.println(rawUUID);String uuid = rawUUID.replaceAll("-", "");System.out.println(uuid);}--输出结果
5c15504c-61cd-430d-9308-5838cf8aec98
5c15504c61cd430d93085838cf8aec98

雪花算法(Snowflake)

        Snowflake 是 Twitter 开源的分布式 ID 生成算法。Snowflake 把64-bit (8个字节)分别划分成多段。

        第 0 位: 符号位(标识正负),始终为 0,没有用,不用管。

        第 1~41 位 :一共 41 位,用来表示时间戳,单位是毫秒,可以支撑 2 ^41毫秒(约 69 年)

        第 42~52 位 :一共 10 位,一般来说,前 5 位表示机房 ID,后 5 位表示机器 ID(实际项目中可以根据实际情况调整),这样就可以区分不同集群/机房的节点,这样就可以表示 32 个 IDC,每个 IDC 下可以有32 台机器。

        第 53~64 位 :一共 12 位,用来表示序列号。 序列号为自增值,代表单台机器每毫秒能够产生的最大 ID 数(2^12 = 4096),也就是说单台机器每毫秒最多可以生成 4096 个 唯一 ID。

优点:

  1. 毫秒数在高位,自增序列在低位,整个 ID 都是趋势递增的。
  2. 以服务的方式部署(可以不依赖数据库等第三方系统),稳定性更高,生成 ID 的性能也非常高的。
  3. 可以根据自身业务特性分配 bit 位,非常灵活。

缺点:

  1. 缺乏协调,还是每个应用自己计算ID。强依赖机器时钟,不同机器间的时钟不一定完全一致;另外,如果机器上时钟回拨(每台机器的时间也不稳定),会导致发号重复 或 服务处于不可用状态。

优化方式:

        从一个地方获取id。通过第三方服务生成时间戳。比如Redis incr指令、zookeeper序列化节点, 缺点是获取id的性能开销变大了。

在实际项目中,我们一般也会对 Snowflake 算法进行改造,最常见的就是在算法生成的 ID 中加入业务类型信息。

分布式ID微服务

美团Leaf方案_Leaf-segment 

重要字段说明:

  • biz_tag 用来区分业务,每个biz-tag 的ID 获取相互隔离
  • max_id 表示该biz_tag 目前所被分配的ID 号段的最大值
  • step 表示每次分配的号段长度

         MySQL 每次获取 ID 是批量获取,每次获取一个 segment(step 决定大小)号段的值。用完之后再去数据库获取新的号段,可以大大的减轻数据库的压力。

优点:

  1. Leaf 服务可以很方便的线性扩展。
  2. ID 号码是趋势递增8byte的64 位数字,满足上述数据库存储的主键要求。
  3. 容灾性高:Leaf 服务内部有号段缓存,即使 DB 宕机,短时间内 Leaf 仍能正常对外提供服务。
  4. 可以自定义 max_id 的大小,非常方便业务从原有的 ID 方式上迁移过来。

缺点:

  1. ID 号码不够随机,能够泄露发号数量的信息,不太安全。 Leaf-segment 方案可以生成趋势递增的 ID,同时ID 号是可计算的。不可用作订单id。
  2. TP999 数据波动大,当号段使用完之后还是会在获取新号段时在更新数据库的I/O 依然会存在着等待,tg999 数据会出现偶尔的尖刺。
  3. DB 宕机会造成整个系统不可用。

双buffer优化:

        针对第二个缺陷,采用双 buffer 的方式,Leaf 服务内部有两个号段缓存区 segment。当前号段已下发10%时,如果下一个号段未更新,则另启一个更新线程去更新下一个号段。

Leaf高可用容灾:

        针对第三个缺陷,可以采用一主两从的方式,同时分机房部署,Master 和Slave 之间采用半同步方式同步数据。采用一定的算法保证数据一致性。(奇虎360 的Atlas 数据库中间件、类 Paxos算法)

美团Leaf方案_Leaf-snowflake

        针对雪花算法的时间戳字段做优化。Leaf-snowflake 方案完全沿用snowflake 方案的bit 位设计。对于workerId的分配,因为Leaf服务规模较大,所以使用 Zookeeper 持久顺序节点的特性自动对 snowflake 节点配置 wokerID。

        弱依赖zookeeper,除了每次会去 ZK 拿数据以外,也会在本机文件系统上缓存一个 workerID 文件。当ZooKeeper 出现问题,恰好机器出现问题需要重启时,能保证服务能够正常启动。

http://www.xdnf.cn/news/1199377.html

相关文章:

  • [STM32][HAL]stm32wbxx 超声波测距模块实现(HY-SRF05)
  • selenium完整版一览
  • 三、搭建springCloudAlibaba2021.1版本分布式微服务-springcloud loadbalancer负载均衡
  • git 提交时排除一个或多个文件
  • 【H264视频编码】一、基本概念
  • 沪深L2逐笔十档委托队列分时Tick历史数据分析处理
  • 集合框架学习
  • day25
  • vulkan从小白到专家——YUV处理
  • Windows|CUDA和cuDNN下载和安装,默认安装在C盘和不安装在C盘的两种方法
  • 《谁在翻译机器的疼痛?》——故障诊断的认知鸿沟与产教破壁之战!
  • C++ 多线程(一)
  • 低精度训练一:低精度训练介绍与大模型下载
  • 09_opencv_遍历操作图像像素
  • net8.0一键创建支持(RabbitMQ)
  • 【AI论文】WebShaper:通过信息寻求形式化实现主动式数据合成
  • 深入理解Java内存与运行时机制:从对象内存布局到指针压缩
  • 【C++】红黑树实现
  • n8n “Run Once for All Items“和“Run Once for Each Item“区别
  • 基于Springboot+UniApp+Ai实现模拟面试小工具七:前端项目创建及框架搭建
  • cJSON在STM32单片机上使用遇到解析数据失败问题
  • Java面试全栈通关:从微服务到AI的技术深度解析
  • 一文读懂 JWT(JSON Web Token)
  • 【LeetCode刷题指南】--设计循环队列
  • 怎样让阿里云服务器(centos)有界面
  • 机械学习----knn实战案例----手写数字图像识别
  • Kotlin位运算
  • 板凳-------Mysql cookbook学习 (十二--------3_3)
  • BUG记录——Request接传Json数据中文乱码
  • Spring Boot + @RefreshScope:动态刷新配置的终极指南