当前位置：首页 > ops >正文

NVIDIA英伟达describe-anything软件本地电脑安装部署完整教程

ops 2025/7/18 15:21:40

describe-anything是英伟达联合其他大学开发的一款图片视频内容分析总结软件，可通过AI描述任意图片视频选中区域内容，非常强大，下面是describe-anything本地电脑安装部署教程。

首先电脑上安装git

https://github.com/git-for-windows/git/releases/download/v2.49.0.windows.1/Git-2.49.0-64-bit.exe

安装python 3.10

Python Releases for Windows | Python.org

启动cmd终端窗口，克隆项目库

git clone https://github.com/NVlabs/describe-anything
cd describe-anything

创建python虚拟环境，py310为虚拟环境名，你也可以命名其它名字

python -m venv py310

激活虚拟环境py310

py310\Scripts\activate

安装环境依赖包

pip install .

安装cuda 版torch

pip3 install torch torchvision --force-reinstall --index-url https://download.pytorch.org/whl/cu128

pip install numpy==1.26.4 --force-reinstall

运行命令启动图片处理webui

python demo_simple.py

运行时软件会自动从huggingface下载模型文件

如果需要使用视频识别功能，需要安装用于视频处理功能的sam2

git clone https://github.com/facebookresearch/sam2.git
cd sam2

运行下面命令安装

set SAM2_BUILD_CUDA=0

pip install ".[notebooks]"

注意sam2也是安装到py310虚拟环境中的

describe-anything文件夹下创建checkpoints文件夹
下载模型文件：https://dl.fbaipublicfiles.com/segment_anything_2/092824/sam2.1_hiera_large.pt
放入checkpoints文件夹内

启动视频处理webui

python demo_video.py

运行时软件会自动从huggingface下载模型文件

模型下载完成后在浏览器地址栏里输入：http://127.0.0.1:7860

即可打开webui界面

查看全文

http://www.xdnf.cn/news/9926.html

windows-cmd 如何查询cpu、内存、磁盘的使用情况

血糖监测仪解决方案推荐芯片-NRF52832/HS6621/OM6626

unity入门：同一文本不同颜色显示

长短期记忆（LSTM）网络模型

Live Helper Chat 安装部署

Science Advances 上海理工大学与美国杜克大学（Duke University）共同开发了一种仿生复眼相机

springboot项目下面的单元测试注入的RedisConnectionFactory类redisConnectionFactory值为什么为空呢？

JavaScript极致性能优化全攻略

苏州SAP代理公司排名：工业园区企业推荐的服务商

LabVIEW输血袋字符智能检测系统

四、关系数据库标准语言SQL_1

windows下安装docker、dify、ollama

Chainlink：连接 Web2 与 Web3 的去中心化桥梁

go的select多路复用

ES分词搜索

#13 学习反馈

【AI-安装指南】Redis Stack 的安装与使用

二分法算法技巧-思维提升

接口自动化测试用例的编写方法

pandas数据分析

简述synchronized和java.util.concurrent.locks.Lock的异同？

Idea使用springAI搭建MCP项目

torch.zeros()用法简介

c# 获取电脑分辨率及 DPI 设置

Root权限：解锁Android的终极力量

WSL里执行python深度学习的一些方法记录

如何优化Hive的查询性能？请详细说明查询优化的各个层面（SQL优化、配置优化、资源优化等）和具体方法。

onlyoffice docspace 协作空间企业版使用秘籍-1.如何连接外部存储

数据结构之队列：原理与应用

下载即转化的商业密码：解析华为应用商店CPD广告的智能投放逻辑

相关文章：