当前位置: 首页 > backend >正文

人形机器人的 “灵动密码”:动作捕捉与 AI 如何为其注入活力

在2025年的蛇年春晚中,宇数科技公司生产研发的人形机器人H1在《秧bot》节目中大放异彩,与真人配合默契,为现场及电视机前的观众带来了一场传统艺术与先进科技相结合的视听盛宴,更将国产机器人的话题推向了前所未有的热度。

*图片素材来源网络

那你知道如此灵活的机器人运动是如何实现的吗?关键就是动作捕捉与AI技术。值得一提的是,目前行业顶尖的机器人研发及生产机构普遍都采用动作捕捉系统来构建人形机器人训练的基础数据库。其基本原理是通过固定在运动物体特定部位的跟踪装置例如惯性传感器等来获取运动物体的运动信息,再实时传输至motion capture系统进行处理,转换成计算机可识别的运动数据,并结合三维模型进行实时显示。其中转换好的运动数据可以以常见的数据格式进行导出,再应用在人形机器人系统上,结合AI深度学习算法完成数据分析、处理与优化过程。这种基于数据驱动的AI训练模式,可以让人形机器人在更加短的时间内学会复杂的动作,显著提高训练的效率与成果精度。

例如在宇数机器人的《秧bot》节目中,在动作学习初期就曾采集超过2000组人类秧歌演员动捕数据,这些动捕数据为机器人的动作学习提供了坚实的数据基础,最终呈现出了一场流畅且灵动的舞蹈表演。

而在运动数据采集过程中,动作数据的精度与便捷性是使用动作捕捉技术首要考虑的一个问题。目前市面上常见的几种动作捕捉技术按照系统不同,可分为机械式、电磁式、声学式、光学式、与惯性式。这几种捕捉方式各有优缺,其中惯性式与光学式是目前主流的两种运动数据采集方式。

惯性式顾名思义即通过惯性传感器对运动物体的运动位置信息进行采集,其中动捕演员需要穿戴动捕服或者织带进行动作采集。通过蓝牙等无线传输方式可将姿态信号实时传送至数据处理系统,进行运动解算,最后以三维模型进行直观的动作重现。其优点是成本低,便携性强,且几乎不受空间限制,可随时进行户内外使用。

例如广州虚拟动力的VDSuitFull就是一款高精度的惯性动作捕捉设备,可以对人体的身体及手指姿态进行一体式的数据采集,并可以以多种数据格式进行导出,适应多种开发平台。动捕系统配套Linux插件,可将动作数据实时传输至linux系统,方便基于Linux环境开发的机器人操纵系统(ROS)便捷获取运动数据进行训练。此外该动捕系统开发的动捕数据重定向功能,支持将身体动作数据重定向到 MuJoCo仿真平台中的宇树 G1 机器人上,支持G1 23自由度与29自由度两个版本,通过在虚拟仿真平台中进行训练,从而降低训练成本。

光学式动作捕捉则是基于计算机视觉原理,通过多个高速运动的相机从不同角度对目标特征点(标记点)进行连续的监视与跟踪来完成捕捉任务。其优点是精度高,可捕捉快速运动并进行空间定位,但是造价昂贵,不可移动,对于动作捕捉场景具有一定限制。

此外,基于摄像头视觉识别技术的无穿戴动作捕捉系统也是一种便捷的动作数据采集方案。例如广州虚拟动力的偃动坊无穿戴实时动作捕捉系统,真人只需要站在摄像头可捕捉的范围内,无需穿戴任何设备就可以进行动作数据的高效采集,可确保动作表现的舒展性,且支持双人动捕,可模拟双人交互场景,为人形机器人的训练提供坚实的数据基础。

随着动作捕捉技术与AI技术的不断发展,该两种方式的结合势必会为人形机器人的发展开辟出更加广阔的前景。广州虚拟动力将继续专研于动作捕捉领域,致力于为人形机器人动作训练提供更加坚实的技术支撑!

http://www.xdnf.cn/news/3351.html

相关文章:

  • BOSS的收入 - 华为OD机试(A卷,Java题解)
  • React-Native Android 多行被截断
  • Ubuntu 22.04 的 ROS 2 和 Carla 设置指南(其一)
  • Multicore-TSNE
  • 如何用GPU Instancing来优化树木草石重复模型
  • Kubernetes 配置中的 Selector 详解
  • GPU集群搭建步骤
  • 基础术语说明
  • 前端项目问题:TypeError: Failed to fetch dynamically imported module
  • 数据结构---【二叉搜索树】
  • Canvas基础篇:图形绘制
  • 工业质检领域相关近期顶会论文汇总CVPR2025
  • SALOME源码分析: SMESH模块
  • 2025-04-30 AIGC-如何做短片视频
  • 科学数据可视化工具库visIt安装和使用
  • 阿里云短信接入实现示例
  • IsaacLab最新2025教程(7)-创建Interactive Scene
  • Socket-UDP
  • Day.js一个2k轻量级的时间日期处理库
  • Modbus转PROFIBUS网关:电动机保护新突破!
  • [CPCTF 2025] Crypto
  • YOLOv11改进:视觉变换器SwinTransformer目标检测网络
  • C 语言链表详解
  • 第 11 届蓝桥杯 C++ 青少组中 / 高级组省赛 2020 年真题答和案解析
  • 测试 用例篇
  • 指令级并行(ILP)和线程级并行(TLP)的区别,GCC -O3优化会展开循环吗?
  • Git 忽略文件配置 .gitignore
  • AI对IT行业的重塑:挑战与机遇并存的技术革命
  • URP - 序列图动画的实现
  • 多数元素题解(LC:169)