当前位置: 首页 > news >正文

THUNDER:用“听回去”的方式让数字人说话更像真人

 

在虚拟数字人和AI交互日益普及的今天,如何让数字人的面部动作更加自然、真实,尤其是嘴型与语音高度同步,成为提升用户体验的关键。而来自马克斯·普朗克智能系统研究所(MPI-IS)的研究团队提出了一种全新思路 —— THUNDER,它不仅能根据语音生成高质量的3D面部动画,还能通过“听回去”机制不断自我校正,显著提升口型准确性。


一句话理解 THUNDER

传统方法是让数字人“听音频动嘴”,而 THUNDER 是让它“看嘴型反推音频”,再用这个音频来判断嘴型动得对不对,从而反过来提升口型准确度!


为什么这项技术很重要?

✅ 自动生成逼真口型动画

只需输入一段语音,THUNDER 即可自动生成自然流畅、情感丰富的3D面部动画。适用于虚拟主播、AI讲解员、数字替身等各类数字人应用场景。

✅ 提升口型同步精度

不同于以往模型只关注“嘴巴有没有动”,THUNDER 更注重“嘴巴动得对不对”。它通过重建语音并比对原始语音的方式,实时检测并纠正

http://www.xdnf.cn/news/864271.html

相关文章:

  • 内网穿透之Linux版客户端安装(神卓互联)
  • 【学习笔记】TCP 与 UDP
  • 化学方程式配平免费API接口教程
  • 图像处理、图像分析和图像理解的定义、联系与区别
  • vue 多端适配之pxtorem
  • 论文阅读笔记——Large Language Models Are Zero-Shot Fuzzers
  • 如何安全高效的文件管理?文件管理方法
  • MySQL补充知识点学习
  • 【触想智能】工业一体机在工厂智能化升级改造中的作用和应用分析
  • AI数字人在说话时怎样模拟呼吸?
  • Appium+python自动化(九)- 定位元素工具
  • cocos3.X的oops框架oops-plugin-excel-to-json改进兼容多表单导出功能
  • [特殊字符] 在 React Native 项目中封装 App Icon 一键设置命令(支持参数与默认路径)
  • git stash命令用法
  • Docker 部署 Python 的 Flask项目
  • STM32----IAP远程升级
  • Go语言学习-->项目中引用第三方库方式
  • 《短线追涨与低吸技术》速读笔记
  • sqli-labs靶场38-45关(堆叠注入)
  • MCP协议重构AI Agent生态:万能插槽如何终结工具孤岛?
  • 在 Android 框架中,接口的可见性规则
  • 考研系列—操作系统:冲刺笔记(1-3章)
  • 互斥锁与消息队列的架构哲学
  • 如何用AI高效运营1000+Tiktok矩阵账号
  • 图片压缩工具 | 图片生成PDF文档
  • 将word文件转为kindle可识别的azw3文件的方法
  • AWS DocumentDB vs MongoDB:数据库的技术抉择
  • 在CSDN发布AWS Proton解决方案:实现云原生应用的标准化部署
  • Edge Databases:赋能分布式计算环境
  • PPTAGENT:让PPT生成更智能