当前位置：首页 > news >正文

THUNDER：用“听回去”的方式让数字人说话更像真人

news 2025/6/6 16:14:55

在虚拟数字人和AI交互日益普及的今天，如何让数字人的面部动作更加自然、真实，尤其是嘴型与语音高度同步，成为提升用户体验的关键。而来自马克斯·普朗克智能系统研究所（MPI-IS）的研究团队提出了一种全新思路 —— THUNDER，它不仅能根据语音生成高质量的3D面部动画，还能通过“听回去”机制不断自我校正，显著提升口型准确性。

一句话理解 THUNDER

传统方法是让数字人“听音频动嘴”，而 THUNDER 是让它“看嘴型反推音频”，再用这个音频来判断嘴型动得对不对，从而反过来提升口型准确度！

为什么这项技术很重要？

✅ 自动生成逼真口型动画

只需输入一段语音，THUNDER 即可自动生成自然流畅、情感丰富的3D面部动画。适用于虚拟主播、AI讲解员、数字替身等各类数字人应用场景。

✅ 提升口型同步精度

不同于以往模型只关注“嘴巴有没有动”，THUNDER 更注重“嘴巴动得对不对”。它通过重建语音并比对原始语音的方式，实时检测并纠正

http://www.xdnf.cn/news/864271.html

相关文章：

内网穿透之Linux版客户端安装（神卓互联）

【学习笔记】TCP 与 UDP

化学方程式配平免费API接口教程

图像处理、图像分析和图像理解的定义、联系与区别

vue 多端适配之pxtorem

论文阅读笔记——Large Language Models Are Zero-Shot Fuzzers

如何安全高效的文件管理？文件管理方法

MySQL补充知识点学习

【触想智能】工业一体机在工厂智能化升级改造中的作用和应用分析

AI数字人在说话时怎样模拟呼吸？

Appium+python自动化（九）- 定位元素工具

cocos3.X的oops框架oops-plugin-excel-to-json改进兼容多表单导出功能

[特殊字符] 在 React Native 项目中封装 App Icon 一键设置命令（支持参数与默认路径）

git stash命令用法

Docker 部署 Python 的 Flask项目

STM32----IAP远程升级

Go语言学习--＞项目中引用第三方库方式

《短线追涨与低吸技术》速读笔记

sqli-labs靶场38-45关（堆叠注入）

MCP协议重构AI Agent生态：万能插槽如何终结工具孤岛？

在 Android 框架中，接口的可见性规则

考研系列—操作系统：冲刺笔记（1-3章）

互斥锁与消息队列的架构哲学

如何用AI高效运营1000+Tiktok矩阵账号

图片压缩工具 | 图片生成PDF文档

将word文件转为kindle可识别的azw3文件的方法

AWS DocumentDB vs MongoDB：数据库的技术抉择

在CSDN发布AWS Proton解决方案：实现云原生应用的标准化部署

Edge Databases：赋能分布式计算环境

PPTAGENT：让PPT生成更智能