当前位置: 首页 > java >正文

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

视频讲解:

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

今天介绍下stable_baselines3和gym,可以方便实现DL的实现,应用在机械臂catch、reach等场景

测试代码仓库:https://github.com/LitchiCheng/DRL-learning.git

https://stable-baselines3.readthedocs.io/en/master/

stable_baselines3 是一个用于深度强化学习的开源 Python 库,基于 PyTorch 构建,内置了像PPO、DDPG 等算法

pip3 install stable-baselines3

https://www.gymlibrary.dev/

OpenAI Gym 用于提供一系列标准化的环境,这些环境主要的接口方法包括 reset() 用于重置环境状态,step(action) 用于执行一个动作并返回新的状态、奖励、是否终止等信息

pip3 install gym

新建python代码CartPole-byStablebaselines3.py

使用gym和stable_baselines3训练下倒立摆CartPole-v1

import gym
from stable_baselines3 import PPOenv = gym.make('CartPole-v1', render_mode="human")
model = PPO('MlpPolicy', env, verbose=1)
model.learn(total_timesteps=10000)
model.save("ppo_cartpole")
env.close()

http://www.xdnf.cn/news/1416.html

相关文章:

  • 【C++】vector扩容缩容
  • 2025/4/23 心得
  • 视频图片去水印处理图像 HitPaw Watermark Remover 软件工具WIN
  • MacOS中安装Python(homebrew,pyenv)
  • Java实现插入排序算法
  • 杭电oj(1087、1203、1003)题解
  • 云原生--CNCF-3-核心工具介绍(容器和编排、服务网格和通信、监控和日志、运行时和资源管理,安全和存储、CI/CD等)
  • gtest、gmock的使用
  • Google搜索技巧
  • 【官方正版,永久免费】Adobe Camera Raw 17.2 win/Mac版本 配合Adobe22-25系列软
  • 若依项目部署小结
  • OSPF的优化
  • 进程(Process)详解
  • 【自然语言处理与大模型】大模型参数规模与部署配置调查2025第一季度
  • LSA六种类型
  • VScode
  • 5.3 分布式事务
  • git lfs下载大文件限额
  • 查询Hologres或postgresql中的数据
  • php基础
  • 算法训练营第一天|704.二分查找、27.移除元素、977.有序数组的平方
  • 集结号海螺捕鱼组件搭建教程与源码结构详解(第四篇)
  • crictl 拉取镜像报错 Unimplemented desc = unknown service runtime.v1.ImageService
  • redis 使用 Docker 部署 简单的Redis 集群(包括哨兵机制)
  • 修电脑之电脑没有声音
  • 武装Burp Suite工具:xia SQL自动化测试_插件
  • date-picker组件的shortcuts为什么不能配置在vue的data的return中
  • 小红书文字配图平替工具
  • Vue3-原始值的响应式方案ref
  • 实时数仓体系概览与架构演进