当前位置：首页 > ds >正文

实时数字人——DH_LIVE

ds 2025/7/5 22:06:58

前两天亲手搭建了实时对话数字人VideoChat，今天来搭建下DH_LIVE。

DH_LIVE一个实时数字人解决方案，从输入文字到数字人对口型说话用时2-3秒。

今天就来实际操作下dh_live的搭建过程。

首先贴上git地址：https://github.com/kleinlee/DH_live

然后又找到了个带webui的开源地址：https://github.com/v3ucn/DH_live_webui 含一键启动脚本。

1、先来看下自己本地的环境配置：

系统：win10

显卡：rtx 2060 super

2、创建环境

conda create -n dhlive python==3.10

3、创建好后激活环境，进入到项目目录

conda activate dhlive

4、安装环境

pip install -r requirements.txt

5、安装比较顺利，直接安装成功了，接着来试着启动下

python api.py

报错了。如图：

这种比较好解决，直接 pip install pydub 即可。

6、接着再次执行第五步，又报错，如图：

pip install torchaudio

7、继续执行第五步，还报错

这是ffmpeg没有配置环境变量，配置下即可。

我的电脑--》右键--》属性--》高级系统设置--》环境变量--》系统变量--》path--》新建--》添加ffmpeg的bin路径保存即可。后台回复"ffmpeg"可获取ffmpeg文件

配置好后重启打开窗口执行ffmpeg

看到输出即为配置成功。

8、接着再执行第五步，又报错

pip install edge_tts

9、接着执行第五步，终于成功了

经实测，效果还不错，就是口型有点不太对应。从输入到说话的间隔要看文本长度。

后台回复“DH_LIVE”可获取到一键启动的项目文件，包含checkpoints模型文件。

查看全文

http://www.xdnf.cn/news/1640.html

矩阵运算和线性代数操作开源库

Unreal Niagara制作SubUV贴图翻页动画

实现营销投放全流程自动化超级汇川推出信息流智能投放产品“AI智投“

DDD领域驱动与传统CRUD

缓存集群技术深度解析：从原理到实战

数据结构-排序

C#基于Sunnyui框架和MVC模式实现用户登录管理

PH热榜 | 2025-04-24

【网络应用程序设计】实验四：物联网监控系统

发币流程是什么，需要多少成本？

深入详解人工智能数学基础——概率论中的KL散度在变分自编码器中的应用

数据库安装和升级和双主配置

深度解析：基于Python的微信小程序自动化操作实现

优化uniappx页面性能，处理页面滑动卡顿问题

时序数据库IoTDB构建的能源电力解决方案

JVM-类加载机制

【docker】 pull FROM build

3.1.3 materialDesign:DialogHost 使用介绍

Whisper微调及制作方言数据集

Golang 闭包学习

arm64适配系列文章-第三章-arm64环境上mariadb的部署

一行命令打开iOS模拟器

uniapp -- 实现微信小程序、app、H5端视频上传

ORACLE RAC环境使用ASM机制零宕机时间更换存储的实践

简单几步，开启 Intel VT-x 让电脑“解开CPU封印”

相关文章：