当前位置: 首页 > web >正文

vggt复现

项目地址:

GitHub - facebookresearch/vggt: [CVPR 2025 Best Paper Award] VGGT: Visual Geometry Grounded Transformer

一、下载权重

参考(CVPR2025)Best paper VGGT论文的复现_vggt复现-CSDN博客

由于权重是在Hugging Face,国内仍然下载非常慢挂上梯子后,从(https://huggingface.co/facebook/VGGT-1B/resolve/main/model.pt)下载,然后保存到自己的本地路径。

修改原仓库的demo_gradio.py,将加载模型的代码改为本地加载。对应32-34行,改为如下代码,checkpoint_path对应自己的路径即可。

checkpoint_path = "./checkpoint/model.pt"
state_dict = torch.load(checkpoint_path)
model = VGGT()
model.load_state_dict(state_dict)

二、复现

conda create -n vggt python=3.10
conda activate vggt
pip install -r requirements.txt
pip install -r requirements_demo.txt
python demo_gradio.py

点击上面的URL,上传图片或视频或选择网页上的例子,点击“重建”

21帧,用时220s

8帧,用时28s

http://www.xdnf.cn/news/18577.html

相关文章:

  • 正点原子【第四期】Linux之驱动开发学习笔记-2.1LED灯驱动实验(直接操作寄存器)
  • Mysql InnoDB 底层架构设计、功能、原理、源码系列合集【四、事务引擎核心 - MVCC与锁机制】
  • 【AI应用】向量数据库Milvus详细命令
  • 找不到vcruntime140_1.dll 无法执行的故障要怎么搞?解决方法分享
  • MiniCPM-V4.0开源并上线魔乐社区,多模态能力进化,手机可用,还有最全CookBook!
  • CVPR焦点 | 神经网络新范式:轻量化与精度并行,重塑视觉任务性能天花板
  • 树状数组【原理+详解+例题】
  • 在Excel和WPS表格中如何隐藏单元格的公式
  • 改善收敛性有什么作用?收敛代表什么
  • 【Linux】Vim编辑器:从入门到高效使用
  • kafka生产者 消费者工作原理
  • golang 非error错误分类
  • 什么是短视频矩阵系统企业立项功能源码开发,支持OEM
  • 华为云物联网产品架构解析:资源空间、群组、产品、标签、网关、设备与子设备的关系梳理与设置指南
  • 【GPT入门】第54课 量化位数与存储大小的影响
  • 开发避坑指南(31):Oracle 11g LISTAGG函数使用陷阱,缺失WITHIN子句解决方案
  • Node.js中Express框架入门教程
  • PHY芯片的作用
  • C#_异步编程范式
  • DOLO 上涨:Berachain 生态爆发的前奏?
  • 血管介入医疗AI发展最新方向与编程变革:从外周、神经到冠脉的全面解析
  • 【笔记】动手学Ollama 第七章 应用案例 Agent应用
  • C++的指针和引用:
  • Apache HTTP Server:深入探索Web世界的磐石基石!!!
  • 第5.3节:awk数据类型
  • 部署Qwen2.5-VL-7B-Instruct-GPTQ-Int3
  • linux中的iptables的简介与常用基础用法
  • ES_分词
  • OpenCV图像形态学操作
  • 智能求职推荐系统