SONiC系统之高速数据遥测High Frequency Telemetry
SONiC系统之高速数据遥测High Frequency Telemetry
数据遥测
这篇文章介绍了SONiC系统支持Telemetry的软件架构以及gNMI接口中Telemetry Streaming功能Dial-in和Dial-out两者模式的区别。正如该文指出的那样,该结构面临扩展性问题,当AI训练、推理等大型业务对网络性能的波动越来越敏感,网络运维需要更高速率和更高精度的网络实时性能监控。大量的统计信息和状态信息甚至希望以一秒为间隔不断上报,大量的数据上报更加加重了该结构的性能瓶颈问题。
高速数据遥测
SONiC系统通过对软件结构的改进,通过增加counter syncd这样一个新的进程,通过netlink接口从内核向Telemetry应用主动传递性能信息,绕开数据库的读写,加快数据输出的速率。
实际性能数据的获取通过DMA操作来代替单个寄存器的读写也大大加快的性能数据获取的速率。