当前位置: 首页 > ds >正文

LeRobot 项目部署运行逻辑(七)—— ACT 在 Mobile ALOHA 训练与部署

全部流程为:硬件配置 -> 环境安装 -> 遥操作数据采集 -> 数据集可视化 -> 策略训练 -> 策略评估

在之前的笔记中已经完成了绝大部分,最后再记录一下最后的训练部署,算是最简单的部分了

目录

1 ACT 训练

2 ALOHA 部署

3 更多细节


1 ACT 训练

lerobot 目前支持算法在 lerobot/common/policies 中可以查看

之前数据采集完成了,修改相应参数,运行如下指令开始训练:

python lerobot/scripts/train.py 
--dataset.repo_id=lerobot/collection_coil  \
--dataset.root=/home/robot/Documents/lerobotnew/collections/collection_coil/  \
--policy.type=act  \
--output_dir=/home/robot/Documents/lerobotnew/outputs/train/act_collection_coil  \
--job_name=act_collection_coil  \
--policy.device=cuda  \
--wandb.enable=true

训练完成后,在 outputs 中生成权重参数:

2 ALOHA 部署

连上机器人和相机,运行如下脚本测试:

python lerobot/scripts/control_robot.py  
--robot.type=aloha   \
--control.type=record   \
--control.fps=30    \
--control.single_task="collection_coil."   \
--control.repo_id=lerobot/eval_collection_coil  \
--control.tags='["collection_coil"]' \
--control.warmup_time_s=3  \
--control.episode_time_s=50  \
--control.reset_time_s=5  \
--control.num_episodes=1  \
--control.policy.path=/home/robot/Documents/lerobotnew/outputs/train/act_collection_coil/checkpoints/last/pretrained_model  \
--control.num_image_writer_processes=1

PS: --control.repo_id 必须是 eval_

可以看到简单任务的效果还行:

部分复杂任务也还行,成功率也还可以:

3 更多细节

1. 数据量我们目前简单动作用的是50组,成功率在90%左右,但是这种成功率在于机器人相机要固定住的前提上,所以如果想泛化能力强,还是需要更多的 diverse 数据;

2. 采集数据和部署可以时间不一致,采集可以短一点20s动作,部署建议时间长一点,可以100s剥削机器人不停地干;

3. lerobot 架构功能很多,但是说明很简单,比如删除数据、采集时候可视化、数据继续采集等功能都有,需要自己修改参数;

4. ACT 对于简单功能够用了,但是复杂功能,首先是相机位置和精度很重要,合理布局可以完成部分复杂功能,但是更建议直接上 GR00T 或者 π0 这种 VLM+ACT/DP 的双系统架构,大脑+小脑确实效果好很多

http://www.xdnf.cn/news/5836.html

相关文章:

  • 开发工具分享: Web前端编码常用的在线编译器
  • Matlab 基于滑模自抗扰的高速列车自动驾驶算法研究
  • Linux 软硬连接详解
  • linux下minio的进程管理脚本
  • LMFD格子多相流体力学仿真机:超级计算如何实现平民化?
  • Java高频面试之并发编程-16
  • Mysql的索引,慢查询和数据库表的设计以及乐观锁和悲观锁
  • AUTOSAR图解==>AUTOSAR_TR_GeneralBlueprintsSupplement
  • 知网AI检测对抗智能体,降AI率不再单独花钱!
  • ESP32 web服务导致的lwip “pbuf_free: p->ref > 0问题
  • 【001】renPy android端启动流程分析
  • 内存对齐(Memory Alignment)
  • 4399(简易版) GOC小游戏
  • [python] 面向对象的三大特性-封装及新式类
  • Autoregressive Distillation of Diffusion Transformers
  • IOP|2025第二届机电一体化、机器人与控制系统国际会议(MRCS2025)
  • 电流互感器使用全攻略
  • Hugging Face汉化教程及注册使用详解
  • python-74-Nacos技术之单机模式安装Nacos并使用Python操作Nacos
  • 【Ansible】之inventory主机清单
  • 用 openssl 测试 tls 连接
  • Redis+Caffeine构造多级缓存
  • 多模态链式思考推理:让大模型更像人类一样思考
  • C——五子棋小游戏
  • 互联网大厂Java求职面试:优惠券服务架构设计与AI增强实践-3
  • cursor 出现问题 为客户解决问题
  • 大模型科研能力评价参考平台上线,推动技术创新与发展
  • Koa知识框架
  • 机器学习——集成学习基础
  • 信息安全模型全解:从机密性到完整性的理论基石