当前位置：首页 > web >正文

vggt复现

web 2025/8/23 9:38:12

项目地址：

GitHub - facebookresearch/vggt: [CVPR 2025 Best Paper Award] VGGT: Visual Geometry Grounded Transformer

一、下载权重

参考(CVPR2025)Best paper VGGT论文的复现_vggt复现-CSDN博客

由于权重是在Hugging Face，国内仍然下载非常慢挂上梯子后，从(https://huggingface.co/facebook/VGGT-1B/resolve/main/model.pt)下载，然后保存到自己的本地路径。

修改原仓库的demo_gradio.py，将加载模型的代码改为本地加载。对应32-34行，改为如下代码，checkpoint_path对应自己的路径即可。

checkpoint_path = "./checkpoint/model.pt"
state_dict = torch.load(checkpoint_path)
model = VGGT()
model.load_state_dict(state_dict)

二、复现

conda create -n vggt python=3.10
conda activate vggt
pip install -r requirements.txt
pip install -r requirements_demo.txt
python demo_gradio.py

点击上面的URL,上传图片或视频或选择网页上的例子，点击“重建”

21帧，用时220s

8帧，用时28s

http://www.xdnf.cn/news/18577.html

相关文章：

正点原子【第四期】Linux之驱动开发学习笔记-2.1LED灯驱动实验（直接操作寄存器）

Mysql InnoDB 底层架构设计、功能、原理、源码系列合集【四、事务引擎核心 - MVCC与锁机制】

【AI应用】向量数据库Milvus详细命令

找不到vcruntime140_1.dll 无法执行的故障要怎么搞?解决方法分享

MiniCPM-V4.0开源并上线魔乐社区，多模态能力进化，手机可用，还有最全CookBook！

CVPR焦点 | 神经网络新范式：轻量化与精度并行，重塑视觉任务性能天花板

树状数组【原理+详解+例题】

在Excel和WPS表格中如何隐藏单元格的公式

改善收敛性有什么作用？收敛代表什么

【Linux】Vim编辑器：从入门到高效使用

kafka生产者消费者工作原理

golang 非error错误分类

什么是短视频矩阵系统企业立项功能源码开发，支持OEM

华为云物联网产品架构解析：资源空间、群组、产品、标签、网关、设备与子设备的关系梳理与设置指南

【GPT入门】第54课量化位数与存储大小的影响

开发避坑指南(31)：Oracle 11g LISTAGG函数使用陷阱，缺失WITHIN子句解决方案

Node.js中Express框架入门教程

PHY芯片的作用

C#_异步编程范式

DOLO 上涨：Berachain 生态爆发的前奏？

血管介入医疗AI发展最新方向与编程变革：从外周、神经到冠脉的全面解析

【笔记】动手学Ollama 第七章应用案例 Agent应用

C++的指针和引用：

Apache HTTP Server：深入探索Web世界的磐石基石！！！

第5.3节：awk数据类型

部署Qwen2.5-VL-7B-Instruct-GPTQ-Int3

linux中的iptables的简介与常用基础用法

OpenCV图像形态学操作

智能求职推荐系统