当前位置: 首页 > news >正文

PPO 强化学习机械臂 IK 训练过程可视化利器 Tensorboard

视频讲解:

PPO 强化学习机械臂 IK 训练过程可视化利器 Tensorboard

PPO 强化学习过程中,设置了verbose会显示数据,但还是不够直观,这里上一个可视化利器,Tensorboard,实际上stable baselines3中已经有了这部分的集成,但这个工具实际上在其他的框架上也可以使用,基于web的显示,简便好看。

https://stable-baselines3.readthedocs.io/en/master/guide/tensorboard.html

介绍下环境,ubuntu22.04 wsl,python3.10,无conda环境,安装tensorboard

pip3 install tensorboard -i https://pypi.tuna.tsinghua.edu.cn/simple

使用非常简单,只需要在PPO增加 `tensorboard_log="./tensorboard/"` 即可

model = PPO("MlpPolicy",env,policy_kwargs=policy_kwargs,verbose=1,n_steps=2048,batch_size=64,n_epochs=10,gamma=0.99,learning_rate=3e-4,device="cuda" if torch.cuda.is_available() else "cpu",tensorboard_log="./tensorboard/")

运行后,会在当前目录生成tensorboard文件夹

使用tensorboard指令读取该log,会起一个web可以看

tensorboard --logdir ./tensorboard/

打开浏览器,可以看到训练过程的图表

设置reload的时间,最快30s一次

http://www.xdnf.cn/news/147043.html

相关文章:

  • netcore8.0项目发布到centos,利用nginx反向代理(宝塔面板篇)
  • C++初阶----模板初阶
  • C语言编程--17.有效的括号
  • 氢气泄漏应急预案应包括哪些内容?
  • 【资料推荐】LVDS Owner’s Manual
  • contenthash 持久化缓存
  • MODBUS转ProfiNet边缘计算网关驱动霍尼韦尔HPT温湿度仪表的动态控制闭环方案
  • Shell、Bash 执行方式及./ 执行对比详解
  • 网络通信的字节序
  • Postman-win64-7.2.2 安装教程(Windows 64位详细步骤)
  • API性能瓶颈分析与优化方法
  • QQ音乐安卓版歌曲版权覆盖范围与曲库完整度评测
  • Kubernet查找pods不断重启原因
  • 【Nova UI】十、打造组件库第一个组件-图标组件(下):从.svg 到 SVG Vue 组件的高效蜕变✨
  • gerbera文件转PCB文件-Altium Designer
  • GitHub 趋势日报 (2025年04月24日)
  • 赛灵思 XCKU115-2FLVB2104I Xilinx Kintex UltraScale FPGA
  • Parasoft C++Test软件单元测试_对函数打桩的详细介绍
  • AKM旭化成微电子全新推出能量收集IC“AP4413系列”
  • 自然语言处理+知识图谱:智能导诊的“大脑”是如何工作的?
  • C++中的vector和list的区别与适用场景
  • LLM Graph Rag(基于LLM的事件图谱RAG)
  • 一种用于加密代理流量检测的轻量级深度学习方法
  • jdk-8u202-linux-x64.tar.gz官方下载地址
  • mysql基础——数据表查询(全面解析)
  • 技术书籍推荐(003)
  • A2A与MCP之间的简单理解
  • 【Echarts】使用echarts绘制多个不同类型的中国地图
  • Redis 集群切片全解析:四种常见技术的原理、优劣与应用
  • Github 2025-04-25 Java开源项目日报 Top8