当前位置: 首页 > backend >正文

从人体姿态到机械臂轨迹:基于深度学习的Kinova远程操控系统架构解析

在工业自动化、医疗辅助、灾难救援与太空探索等前沿领域,Kinova轻型机械臂凭借7自由度关节设计和出色负载能力脱颖而出。它能精准完成物体抓取、复杂装配和精细操作等任务。然而,实现人类操作者对Kinova机械臂的直观高效远程控制一直是技术难题。传统远程操作技术或依赖复杂昂贵的主从式机械臂系统,或需要操作者长时间训练。近期一项创新研究提出基于人工智能的远程操作解决方案,有望使Kinova机械臂的远程操作更自然高效。

现有技术局限:传统方法为何难以满足需求?

当前主流机器人远程操作技术包括主从操作和基于视觉的远程操作。主从操作要求操作者操控与目标机械臂相同运动学结构的主机械臂,成本高昂且对不同类型机械臂适应性差。基于视觉的远程操作借助摄像头捕捉手势或环境,再转换为控制指令,虽降低了成本,但在复杂光照条件下准确率下降,难以处理高实时性任务。这两种技术都未能充分利用人类肢体语言和动作意图,导致操作不自然流畅,难以满足复杂任务场景下对机械臂精准控制的需求。

研究突破:深度学习赋能Kinova机械臂远程操作

为克服传统技术局限,研究人员提出基于深度学习的新远程操作方法。核心是构建能学习Kinova机械臂配置空间潜在表示的GRU(门控循环单元)变分自动编码器(VAE)模型,并结合前馈神经网络模块实现人类手臂姿态到机械臂配置的精准映射。

数据收集:构建精准映射基础

研究团队收集了两组关键数据集。一是包含500个随机起始和结束位置的Kinova机械臂关节轨迹数据集,通过MoveIt软件生成轨迹,采用立方样条插值统一时间步长为0.1秒间隔,并将关节角度转换为投影单位值。二是人类手臂关节配置数据集,利用XSens Awinda人体骨骼运动跟踪系统,无线6自由度IMU传感器贴附在人体11个上肢部位,精确捕捉操作者右臂关节角度。通过定义机械臂与人类手臂运动学关联,将人类手臂运动模式转换为机械臂可理解的关节配置指令。

图 1:橙色标签 J1-J7 表示 Kinova 操作臂的关节位置。绿色标签 q1-q7 表示人体手臂关节的位置。箭头显示了操作臂关节与人体上肢运动链之间的映射关系。

GRU-VAE模型:挖掘机械臂运动深层规律

基于收集的数据,研究人员构建GRU-VAE模型。该模型以两个时间步长的关节位置轨迹为输入,利用GRU架构捕捉时序信息,对机械臂运动潜在分布进行近似。编码器将输入轨迹编码为潜在空间中的均值和对数方差,通过重参数化生成潜在特征,再由解码器重建输入轨迹。模型损失函数由轨迹重建损失和KL散度组成,通过调整β参数平衡两者权重。实验表明,采用Sigmoid退火调度器的模型训练效果更佳,为人类手臂姿态映射提供基础。

图 2:基于门控循环单元(GRU)的变分自编码器(VAE)以 2 个时间步长的操作臂关节角度位置轨迹作为输入。它通过使用重参数化技巧对潜在特征进行采样,学习近似的潜在分布,然后将该潜在分布传递给解码器以重建输入轨迹。所学到的潜在分布空间能够近似整个操作臂的配置空间。

前馈神经网络:搭建人类意图到机械臂动作桥梁

为将人类手臂关节配置数据转换为机械臂可执行配置,研究团队引入前馈神经网络模块。该模块以人类手臂关节角度为输入,以VAE潜在特征空间为目标输出,通过均方误差损失函数训练。选择具有自归一化特性的SELU激活函数,降低学习难度,使网络高效学习人类手臂姿态与机械臂配置间的复杂映射关系。训练完成后,该模块能实时接收人类手臂关节角度数据,通过VAE解码器生成对应机械臂关节配置轨迹,实现人类操作意图的精准转换。

图4:本图展示了基于GRU的变分自编码器(VAE)在使用(顶部)和不使用(底部)退火调度器时的训练结果。Z轴表示每个潜在特征L1到L10以及Kinova机器人关节J1到J7的相关系数分数。

实验验证:精准与泛化能力的双重突破

实际实验中,研究人员设置三个预定义目标姿态,要求四名参与者依次控制Kinova机械臂末端执行器抵达目标区域中心,并保持与目标区域表面垂直。结果显示,尽管参与者身体特征各异,均成功完成任务,平均绝对误差仅2.51厘米,目标姿态方向余弦相似度均值达0.97,证明系统高精度和良好泛化能力,为Kinova机械臂在多样化场景下的应用提供支持。

图6:实验设置。操作员需要通过遥操作控制Kinova Gen3七自由度机械臂达到三个指定的目标姿态。

局限与展望:迈向更智能的Kinova机械臂操作时代

该研究虽取得显著成果,但仍存在局限。训练数据仅来自单一个体,可能导致模型对不同操作者适应性偏差。且模型主要关注关节角度映射,缺乏对关节速度信息考量,可能影响操作平滑性和响应速度。未来,研究团队计划扩大训练数据集,纳入更多个体运动模式,并融入关节速度信息,提升模型性能。同时,探索将人体躯干和骨盆运动特征纳入映射体系,增强远程操作自然性和灵活性。

这项基于GRU-VAE和前馈神经网络的Kinova机械臂远程操作技术,为实现更直观高效的人机协作开辟新路径。随着技术进步,Kinova轻型机械臂远程操作将更智能精准,为人类在复杂环境下的工作和生活带来更多便利与可能。

http://www.xdnf.cn/news/4451.html

相关文章:

  • Kubernetes(k8s)学习笔记(九)--搭建多租户系统
  • QMK键盘固件配置详解
  • 2025.05.07-华为机考第三题300分
  • DIFY教程第四弹:通过工作流来创建一个SQL语句的执行器
  • 【计算机基础】任意进制转换方法详解
  • 资产管理系统对比评测:从传统模式到 AI 驱动的变革
  • 引用的使用
  • [Es_1] 介绍 | 特点 | 图算法 | Trie | FST
  • 【C/C++】errno/strerror 和 GetLastError()/FormatMessage 的区别
  • 模拟设计中如何减小失配
  • 4.系统定时器基本定时器
  • 操作系统——第四章(文件的物理结构以及与逻辑结构的对比)
  • Redis相关命令详解与原理
  • 【Agent】使用 Python 结合 OpenAI 的 API 实现一个支持 Function Call 的程序,修改本机的 txt 文件
  • 如何检查 Watchtower 是否正常工作及更新未生效的排查方法【日常排错】
  • 探寻程序开发的个人密码
  • excel 批量导出图片并指定命名
  • Excel点击单元格内容消失
  • 龙虎榜——20250507
  • LVGL -meter的应用
  • phpstudy升级新版apache
  • 如何在金仓数据库KingbaseES中新建一个数据库?新建一个表?给表添加一个字段?
  • 【PostgreSQL数据分析实战:从数据清洗到可视化全流程】8.1 基础图表绘制(折线图/柱状图/散点图)
  • 把本地的文件拷贝到wsl的文件夹下或者 wsl读取本地的文件
  • 使用node.js创建一个简单的服务器
  • WD5040L、 7V 至 37V 的宽输入电压,输出电压范围为 3.3V 至 36V,6A输出、保护功能强,电源管理利器!
  • Redis的缓存穿透、缓存击穿和缓存雪崩
  • ai说什么是注解,并以angular ts为例
  • Go——项目实战
  • 【强化学习】强化学习算法 - 多臂老虎机问题