当前位置：首页 > ds >正文

WebRTC 服务器之Janus架构分析

ds 2025/7/4 3:46:14

1. Webrtc三种类型通信架构

1.1 1 对 1 通信

1 对 1 通信模型设计的主要⽬标是尽量让两个终端进⾏直联，这样即可以节省服务器的资源，⼜可以提⾼⾳视频的服务质量。WebRTC ⾸先尝试两个终端之间是否可以通过 P2P 直接进⾏通信，如果⽆法直接通信的话，则会通过 STUN/TURN 服务器进⾏中转，如下图：

1.2 多对多通信

Mesh 架构：适合刚学习 WebRTC 的场景，简单易实现，但实际应用中因上行带宽占用大、线性资源占用等问题，超过 4 人时问题明显，几乎无人在真实场景中使用。

MCU 架构：硬件 MCU 曾在视频会议广泛应用，技术成熟，但价格昂贵，且随着互联网发展逐步被淘汰；软 MCU 如 FreeSWITCH 虽存在，但因 CPU 消耗大，真正使用者不多。

SFU 架构：近年来流行，是 WebRTC 多方通信媒体服务器的主流架构，具有高灵活性和高性能，配合 Simulcast 或 SVC 模式可更好地适应不同网络和终端，被多数公司采用。

Janus的多方视频通话使用VideoRoom插件，采用SFU架构。

维度	mesh(P2P)	SFU	MCU
延迟	最低（直连）	中等（服务器中转）	最高（处理流程复杂）
带宽消耗	上行压力大（N²增长）	下行压力大（服务器承担）	整体最低（单一流）
扩展性	差（适合1:1）	优（适合中小型会议）	一般（适合大型会议）
服务器成本	低（仅需穿透辅助）	中（高带宽需求）	高（计算+带宽双重压力）
终端要求	需处理多流解码	需多流解码能力	仅需解码单一流
灵活性	高（端到端控制）	高（自由订阅流）	低（布局固定）
典型应用	微信语音、Skype 1:1	Zoom、腾讯会议	传统硬件视频会议系统
特点	多对多，Mesh 结构	发布订阅	混流集合

1.2.1 架构优点

架构方案	优势
Mesh 架构	- 无需中转服务器，直接利用 WebRTC 通信模型，无需额外开发媒体服务器，降低了开发成本和复杂度。 - 充分利用客户端的带宽资源，将服务器端的带宽压力分散到各客户端，节省了服务器成本。 - 原有通信模型的简洁性，这种架构充分利用了现有的 WebRTC 通信模型，结构相对简单，易于实现和维护。
MCU 架构	- 技术成熟，在硬件视频会议领域应用广泛，技术相对成熟可靠，能够提供稳定的通信服务。 - 兼容性强，作为音视频网关，通过解码、再编码可以屏蔽不同编解码设备之间的差异化，满足更多客户的集成需求，提升用户体验和产品竞争力。 - 统一画面输出，将多路视频混合成一路，所有参与者看到的是相同的画面，有助于提供一致的客户体验。
SFU 架构	- 低资源消耗，数据包直接转发，不需要进行编解码操作，对 CPU 资源消耗很小，降低了服务器的硬件成本和运营成本。 - 低延迟，数据包直接转发极大地降低了延迟，提高了通信的实时性，适合对实时性要求较高的应用场景。 - 灵活性高，可以根据终端下行网络状况进行流控，如根据带宽、网络延时情况选择性地丢弃一些媒体数据，以保证通信的连续性，更好地适应不同的网络状况和终端设备。 - 支持多种模式，许多 SFU 实现支持 SVC 模式和 Simulcast 模式，能够更好地适配 WiFi、4G 等不同网络状况，以及 Phone、Pad、PC 等不同终端设备，提高了系统的兼容性和可用性。

架构

方案

优势

Mesh 架构

- 无需中转服务器，直接利用 WebRTC 通信模型，无需额外开发媒体服务器，降低了开发成本和复杂度。

- 充分利用客户端的带宽资源，将服务器端的带宽压力分散到各客户端，节省了服务器成本。

- 原有通信模型的简洁性，这种架构充分利用了现有的 WebRTC 通信模型，结构相对简单，易于实现和维护。

MCU 架构

- 技术成熟，在硬件视频会议领域应用广泛，技术相对成熟可靠，能够提供稳定的通信服务。

- 兼容性强，作为音视频网关，通过解码、再编码可以屏蔽不同编解码设备之间的差异化，满足更多客户的集成需求，提升用户体验和产品竞争力。

- 统一画面输出，将多路视频混合成一路，所有参与者看到的是相同的画面，有助于提供一致的客户体验。

SFU 架构

- 低资源消耗，数据包直接转发，不需要进行编解码操作，对 CPU 资源消耗很小，降低了服务器的硬件成本和运营成本。

- 低延迟，数据包直接转发极大地降低了延迟，提高了通信的实时性，适合对实时性要求较高的应用场景。

- 灵活性高，可以根据终端下行网络状况进行流控，如根据带宽、网络延时情况选择性地丢弃一些媒体数据，以保证通信的连续性，更好地适应不同的网络状况和终端设备。

- 支持多种模式，许多 SFU 实现支持 SVC 模式和 Simulcast 模式，能够更好地适配 WiFi、4G 等不同网络状况，以及 Phone、Pad、PC 等不同终端设备，提高了系统的兼容性和可用性。

Simulcast 模式就是指视频的共享者可以同时向 SFU 发送多路不同分辨率的视频流（⼀般为三路，如 1080P、720P、360P）。⽽ SFU 可以将接收到的三路流根据各终端的情况⽽选择其中某⼀路发送出去。例如，由于 PC 端⽹络特别好，给 PC 端发送 1080P 分辨率的视频；⽽移动⽹络较差，就给 Phone 发送 360P 分辨率的视频。 Simulcast 模式对移动端的终端类型⾮常有⽤，它可以灵活⽽⼜智能地适应不同的⽹络环境。

SVC（ Scalable Video Coding）是可伸缩的视频编码模式。与 Simulcast 模式的 SVC 模式是同时传多路流不同，在视频编码时做“ ⼿脚” 。它在视频编码时将视频分成多层—— 核⼼层、中间层和扩展层。上层依赖于底层，⽽且越上层越清晰，越底层越模糊。在带宽不好的情况下，可以只传输核⼼层，在带宽充⾜的情况下，可以将三层全部传输过去。