当前位置: 首页 > news >正文

李飞飞World Labs开源革命性Web端3D渲染器Forge!3D高斯溅射技术首次实现全平台流畅运行

在AI与3D技术深度融合的今天,李飞飞领衔的World Labs团队再次成为行业焦点。今日,他们正式开源了Forge——一款专为Web端设计的3D高斯溅射(3D Gaussian Splatting)渲染器,不仅支持THREE.js生态,更能在手机、XR设备等低功耗硬件上实现实时流畅渲染。这一工具的诞生,标志着3D生成与交互技术迈向了更普适、更开放的新阶段。

 

 

一、技术突破:3D高斯溅射为何成为新风口?

3D高斯溅射(3D Gaussian Splatting, 3DGS)是一种基于显式辐射场建模的图形学技术。其核心原理是通过椭球状高斯分布对三维场景进行离散建模,每个高斯粒子包含位置、协方差矩阵(控制形状与方向)、颜色(支持视角相关变化)和透明度等参数。通过可微分光栅化技术,Forge实现了渲染过程与梯度计算的兼容性,从而支持基于优化算法(如梯度下降)的参数迭代,最终拟合多视角输入图像的几何与外观信息。

 

传统方法的局限:

内存占用高:网格模型难以处理百万级复杂场景;

动态交互弱:无法实时修改或动画化3D对象;

跨平台兼容性差:依赖WebGPU等高性能API,移动端体验受限。

3DGS的三大优势:

高效存储

:百万级粒子即可表示复杂场景,内存占用比网格模型降低1-2个数量级;

实时渲染

:基于瓦片的光栅化算法支持1080P分辨率下≥30FPS的流畅体验;

跨领域融合

:可与光线追踪引擎结合,兼顾真实感与创作自由度。

二、Forge的核心突破:让3DGS触手可及

Forge通过GPU优化架构与可编程流水线设计,彻底解决了3DGS的落地难题:

 

1. 全平台兼容,性能"零妥协"

跨设备支持

:覆盖桌面端、移动端(Android/iOS)、XR设备(如Meta Quest 3)及WebXR环境,支持率达98%以上;

动态负载均衡

:根据设备性能自动调整渲染"预算",例如iPhone可处理300万粒子,而低端设备仍能流畅运行百万级场景。

2. 编程式控制,释放创作潜能

动态编辑

:支持实时修改粒子颜色、位移、透明度,并通过骨骼动画系统(双四元数)实现复杂动画;

多Splat交互

:正确排序渲染多个3DGS对象,解决遮挡问题,支持同时渲染多视角输入;

扩展性

:开发者可通过Dyno着色器图形系统注入自定义代码,生成或修改粒子属性,甚至实现粒子级物理模拟。

3. 开源生态,无缝集成THREE.js

格式兼容

:支持主流3DGS文件格式(PLY、SPZ、SPLAT、KSPLAT),并可与传统网格模型混合渲染;

极简开发

:仅需少量代码即可启动渲染器,提供WebGL2回退方案,彻底摆脱对WebGPU的依赖。

三、应用场景:从虚拟世界到工业设计

Forge的开放性使其在多个领域潜力巨大:

 

元宇宙与XR

:构建高保真虚拟场景,支持多人交互与动态内容生成;

游戏开发

:快速生成复杂地形与道具,结合AI实现程序化关卡设计;

工业仿真

:实时渲染机械结构拆解动画,辅助工程师进行可视化调试;

影视创作

:为导演提供低成本预可视化工具,实时预览3D分镜效果。

四、开发者如何快速上手?

访问GitHub仓库:

git clone https://github.com/forge-gfx/forge

基础示例:

import { Forge } from 'forge';

const forge = new Forge();

forge.loadSplat('scene.splat').then(() => {

  forge.start();

});

进阶功能:

通过ForgeViewpoint实现多视角同步渲染;

利用SplatWorker在后台线程处理大规模粒子数据。

五、行业影响:开源推动3D技术民主化

李飞飞在开源公告中表示:"Forge的目标是让开发者像处理三角形网格一样轻松操控3D高斯世界。"这一工具不仅降低了3D内容开发的门槛,更与World Labs此前发布的"单图生成3D世界"技术形成闭环,加速空间智能(Spatial Intelligence)的落地。

 

未来展望:

 

随着多模态AI与大世界模型的成熟,Forge或将成为构建"可交互数字孪生"的基础设施。正如其官网所言:"你的想象力,就是下一个3D世界的边界。"

 

立即体验

👉 访问Forge官网查看网页版Demo

👉 GitHub仓库:https://github.com/forge-gfx/forge

 

http://www.xdnf.cn/news/863047.html

相关文章:

  • VR博物馆推动现代数字化科技博物馆
  • 【Linux】进程 信号保存 信号处理 OS用户态/内核态
  • bug:undefined is not iterable (cannot read property Symbol(Symbol.iterator))
  • Flutter面试题
  • 【学习笔记】Circuit Tracing: Revealing Computational Graphs in Language Models
  • 【OSG学习笔记】Day 15: 路径动画与相机漫游
  • 海康网络摄像头实时取帧转Opencv数组格式(h,w,3),已实现python、C#
  • [C]C语言日志系统宏技巧解析
  • 让视觉基础模型(VFMs)像大语言模型(LLMs)一样“会思考”​
  • 3D视觉重构工业智造:解码迁移科技如何用“硬核之眼“重塑生产节拍
  • SOLIDWORKS 2025教育版提供了丰富的自学资源
  • LabVIEW与Modbus/TCP温湿度监控系统
  • 扫地机产品--材质传感器算法开发与虚拟示波器
  • R语言基础| 下载、安装
  • Elasticsearch中的文档(Document)介绍
  • 代码随想录算法训练营第60期第五十七天打卡
  • Elasticsearch从安装到实战、kibana安装以及自定义IK分词器/集成整合SpringBoot详细的教程(二)
  • 第八部分:阶段项目 6:构建 React 前端应用
  • 华为OD机试_2025 B卷_区间交集(Python,100分)(附详细解题思路)
  • ann算法的种类有哪些,之间的区别,各自的适用场景
  • 每日算法刷题Day22 6.4:leetcode二分答案3道题,用时1h30min
  • 如何在 HTML 中添加按钮
  • 信号与系统汇总
  • Flutter、React Native 项目如何搞定 iOS 上架?从构建 IPA 到上传 App Store 的实战流程全解析
  • RabbitMQ 在解决数据库高并发问题中的定位和核心机制
  • Transformer-BiLSTM、Transformer、CNN-BiLSTM、BiLSTM、CNN五模型时序预测
  • 设计模式-外观模式
  • Java 中 ArrayList、Vector、LinkedList 的核心区别与应用场景
  • 高速ADC数据格式与JESD204B IP数据格式映射关系
  • 数智破局·生态共生:重构全球制造新引擎 2025 WOD制造业数字化博览会即将在沪盛大启幕