当前位置: 首页 > ds >正文

实时数字人——DH_LIVE

前两天亲手搭建了实时对话数字人VideoChat,今天来搭建下DH_LIVE。

DH_LIVE一个实时数字人解决方案,从输入文字到数字人对口型说话用时2-3秒。

今天就来实际操作下dh_live的搭建过程。

首先贴上git地址:https://github.com/kleinlee/DH_live

然后又找到了个带webui的开源地址:https://github.com/v3ucn/DH_live_webui 含一键启动脚本。

1、先来看下自己本地的环境配置:

图片

系统:win10

显卡:rtx 2060 super

2、创建 环境

conda create -n dhlive python==3.10

图片

3、创建好后激活环境,进入到项目目录

conda activate dhlive

4、安装环境

pip install -r requirements.txt

5、安装比较顺利,直接安装成功了,接着来试着启动下 

python api.py

报错了。如图:

图片

这种比较好解决,直接 pip install pydub 即可。

6、接着再次执行 第五步,又报错,如图:

图片

    pip install torchaudio

    7、继续执行第五步,还报错

    图片

    这是ffmpeg没有配置环境变量,配置下即可。

    我的电脑--》右键--》属性--》高级系统设置--》环境变量--》系统变量--》path--》新建--》添加ffmpeg的bin路径保存即可。后台回复"ffmpeg"可获取ffmpeg文件

    图片

    图片

    图片

    图片

    配置好后重启打开窗口执行ffmpeg

    图片

    看到输出即为配置成功。

    8、接着再执行第五步,又报错

    图片

    pip install edge_tts

    9、接着执行第五步,终于成功了

    图片

    经实测,效果还不错,就是口型有点不太对应。从输入到说话的间隔要看文本长度。

    后台回复“DH_LIVE”可获取到一键启动的项目文件,包含checkpoints模型文件。

    http://www.xdnf.cn/news/1640.html

    相关文章:

  • 矩阵运算和线性代数操作开源库
  • Unreal Niagara制作SubUV贴图翻页动画
  • 实现营销投放全流程自动化 超级汇川推出信息流智能投放产品“AI智投“
  • DDD领域驱动与传统CRUD
  • 缓存集群技术深度解析:从原理到实战
  • 数据结构-排序
  • C#基于Sunnyui框架和MVC模式实现用户登录管理
  • PH热榜 | 2025-04-24
  • 【网络应用程序设计】实验四:物联网监控系统
  • 发币流程是什么,需要多少成本?
  • 深入详解人工智能数学基础——概率论中的KL散度在变分自编码器中的应用
  • 数据库安装和升级和双主配置
  • 深度解析:基于Python的微信小程序自动化操作实现
  • 优化uniappx页面性能,处理页面滑动卡顿问题
  • 时序数据库IoTDB构建的能源电力解决方案
  • JVM-类加载机制
  • 【docker】 pull FROM build
  • 3.1.3 materialDesign:DialogHost 使用介绍
  • Whisper微调及制作方言数据集
  • Golang 闭包学习
  • arm64适配系列文章-第三章-arm64环境上mariadb的部署
  • 一行命令打开iOS模拟器
  • uniapp -- 实现微信小程序、app、H5端视频上传
  • ORACLE RAC环境使用ASM机制零宕机时间更换存储的实践
  • matlab 绘图
  • 【leetcode100】目标和
  • MongoDB副本集搭建与核心机制
  • 【MySQL】基本查询
  • 如何解析商品详情页面
  • 简单几步,开启 Intel VT-x 让电脑“解开CPU封印”