当前位置: 首页 > news >正文

PCIe Gen6相比Gen5的新特性、优化点

PCIe Gen6相比Gen5的新特性、优化点

       以下从物理层、数据链路层、系统实现及使用角度,归纳 PCI-Express Gen6 相比 Gen5 的新特性、优化点及使用上的变化。


1. 概述

• Gen5 → 32 GT/s NRZ,Gen6 → 64 GT/s PAM4。“符号率”倍增,实际每条 Lane 原始吞吐率翻倍。
• 向下兼容:Gen6 PHY 可向下回落至 Gen5/Gen4/…;协议栈(Transaction/Data Link 层)几乎无改动,对软件透明。


2. 物理层(PHY)新特性与优化

  1. PAM4 编码

    • 每个时钟周期载入 4 个电平,1 symbol = 2 bit,有效率翻倍。
    • 眼图更小,对抖动与噪声容限更严。
  2. 前向纠错(FEC,Forward Error Correction)

    • 必选:Type 1 RS-FEC,分组长度 128 symbols。
    • 链路误码率(BER)门限由 10⁻²⁵ 放宽到 ≈10⁻⁶,FEC 修复后端到端 BER 达标。
    • FEC block 引入≈15–20% 开销:64 GT/s×2 bit×(1–FECₒₕ) ≈100 Gb/s/Lane。
  3. 信道均衡增强

    • 更强的 CTLE(连续时限均衡)+ DFE(判决反馈均衡)。
    • 自适应均衡系数在 Link Training 中协商;支持更多 Tap 数。
  4. 链路训练协议(LTSSM)扩展

    • 引入新的 Training Sequence(TS3’, TS4’)针对 PAM4、FEC 调优。
    • Negotiation 里增添 FEC Enable、PAM4 Capable 等标志位。
  5. 抖动与眼图规范升级

    • 对垂直/水平抖动容限、双端共模滤波、串扰(crosstalk)有更严格要求。
    • 板级 PCB 路径长度、过孔、走线差分对间距更敏感。

3. 数据链路层与协议层

• FEC 与重传逻辑协同

  • 当 FEC 纠错能力不足时,仍可转入 Replay 机制。
    • 链路状态寄存器扩展
  • 链路能力(Link Capabilities)增加“支持 PAM4/FEC”位;Link Status 里新增 FEC active 状态。
    • 事务层/软件层几乎无改动
  • 仍使用 128b/130b scrambling、Ordered Set、TS1/TS2 等;对上层不暴露新的格式。

4. 性能与延迟

• 带宽
– Raw:Gen6 64 GT/s × 2 bit = 128 Gb/s/Lane
– Net≈100 Gb/s/Lane(扣除 FEC & 8b/10b 之类开销)
– ×16 ≈1.6 Tb/s,两倍于 Gen5 ≈0.8 Tb/s。

• 延迟
– FEC 编码/解码引入≈20–30 ns 端侧处理延迟;但更高级均衡与更低错误重传,整体端到端延迟持平或略优。


5. 硬件实现与生态影响

  1. PCB 与通道设计更严格
    • 更短差分对、减少回波、控制串扰。
  2. Retimer/Redriver 升级
    • 必须支持 PAM4;增加 FEC block。
  3. PHY IP 与 SerDes IP
    • Codecs 更复杂,功耗略增;需更丰富的调试寄存器。
  4. 仿真与测试
    • 测试设备(示波器、BERT)需支持 PAM4 眼图。

6. 在 PCIe 使用上的变化

  1. 向下兼容透明
    • BIOS/固件对新 Capabilities bit 做标记;未更新的系统可回落至 Gen5。
  2. 固件与驱动
    • 在链路初始化(LTSSM)阶段需支持新的 Training Sequence;驱动通常只需识别并配置 FEC Enable bit。
  3. 调试与调校
    • 信号完整性工具需 PAM4 探头;要验证校准系数、FEC 纠错状态。
  4. 电源与散热
    • PAM4 PHY 功耗较 NRZ 增大,需要更好的电源和散热设计。

7. 典型应用场景

• 高性能计算、数据中心互连、AI/机器学习加速卡,尤其需要 > 1 TB/s 带宽场合。
• 固定机架内短距离(up to 1 m)背板或直通线缆,满足更苛刻的信道。


8. 小结

       PCIe Gen6 在物理层向 PAM4+FEC 转型,实现了端到端带宽翻倍,并通过更先进的均衡和误码控制保证信号完整性。对上层协议与软件透明,依然沿用既有事务/数据链路层定义,但在硬件、板级设计、仿真测试、固件初始化上都提出了更高要求。

http://www.xdnf.cn/news/759655.html

相关文章:

  • c++之数组
  • latex 三线表-算法对比表
  • 理解解释器架构:原理、组成与运行机制全解析
  • leetcode hot100 二叉树(一)
  • c++之分支
  • SOC-ESP32S3部分:24-WiFi配网
  • 【PyQt5】从零开始的PyQt5 - QLabel篇
  • 18. Qt系统相关:多线程
  • Matlab作图之 subplot
  • 抖音客户端训练营--day2
  • 一:UML类图
  • JMeter 直连数据库
  • 1Remote远程会话管理以及一键启动虚拟机
  • Spring 中 @Value 注解多实例配置方案详解
  • 看问题的本质背后是什么?
  • pycharm打印时不换行,方便对比观察
  • Vue3.5 企业级管理系统实战(二十一):菜单权限
  • 前端面经 两栏布局
  • 远程管理SSH服务的搭建
  • 论文略读:Uncertainty-Aware Graph Structure Learning
  • 开源版 PyMOL 如何绘制 新冠病毒 分子结构?
  • Vue单文件组件
  • 打卡day42
  • 【Netty】EventLoopGroup
  • waitpid的waitstatus 含义源码解读
  • Linux 内核中 skb_orphan 的深度解析:从版本差异到核心机制
  • JOIN使用的注意事项
  • HTTP协议解析
  • 话题通信之python实现
  • 【免杀】C2免杀技术(十三)Inline Hook 概念篇