NVIDIA英伟达describe-anything软件本地电脑安装部署完整教程
describe-anything是英伟达联合其他大学开发的一款图片视频内容分析总结软件,可通过AI描述任意图片视频选中区域内容,非常强大,下面是describe-anything本地电脑安装部署教程。
首先电脑上安装git
https://github.com/git-for-windows/git/releases/download/v2.49.0.windows.1/Git-2.49.0-64-bit.exe
安装python 3.10
Python Releases for Windows | Python.org
启动cmd终端窗口,克隆项目库
git clone https://github.com/NVlabs/describe-anything
cd describe-anything
创建python虚拟环境,py310为虚拟环境名,你也可以命名其它名字
python -m venv py310
激活虚拟环境py310
py310\Scripts\activate
安装环境依赖包
pip install .
安装cuda 版torch
pip3 install torch torchvision --force-reinstall --index-url https://download.pytorch.org/whl/cu128
pip install numpy==1.26.4 --force-reinstall
运行命令启动图片处理webui
python demo_simple.py
运行时软件会自动从huggingface下载模型文件
如果需要使用视频识别功能,需要安装用于视频处理功能的sam2
git clone https://github.com/facebookresearch/sam2.git
cd sam2
运行下面命令安装
set SAM2_BUILD_CUDA=0
pip install ".[notebooks]"
注意sam2也是安装到py310虚拟环境中的
describe-anything文件夹下创建checkpoints文件夹
下载模型文件:https://dl.fbaipublicfiles.com/segment_anything_2/092824/sam2.1_hiera_large.pt
放入checkpoints文件夹内
启动视频处理webui
python demo_video.py
运行时软件会自动从huggingface下载模型文件
模型下载完成后在浏览器地址栏里输入:http://127.0.0.1:7860
即可打开webui界面