当前位置: 首页 > news >正文

具身系列——PPO算法实现CartPole游戏(强化学习)

完整代码参考: https://gitee.com/chencib/ailib/blob/master/rl/ppo_cartpole.py

执行结果:
ppo训练过程

部分训练得分:

(sd) D:\Dev\traditional_nn\feiai\test\rl>python ppo_cartpole_v2_succeed.py
Ep:    0 | Reward:   23.0 | Running:   23.0
Ep:    1 | Reward:   12.0 | Running:   21.9
Ep:    2 | Reward:   31.0 | Running:   22.8
Ep:    3 | Reward:   25.0 | Running:   23.0
Ep:    4 | Reward:    9.0 | Running:   21.6
Ep:    5 | Reward:   20.0 | Running:   21.5
Ep:    6 | Reward:   20.0 | Running:   21.3
Ep:    7 | Reward:   28.0 | Running:   22.0
Ep:    8 | Reward:   32.0 | Running:   23.0
Ep:    9 | Reward:   18.0 | Running:   22.5
……
Ep:  990 | Reward:   15.0 | Running:   19.7
Ep:  991 | Reward:   19.0 | Running:   19.7
Ep:  992 | Reward:   20.0 | Running:   19.7
Ep:  993 | Reward:   24.0 | Running:   20.1
Ep:  994 | Reward:   16.0 | Running:   19.7
Ep:  995 | Reward:   20.0 | Running:   19.7
Ep:  996 | Reward:   19.0 | Running:   19.7
Ep:  997 | Reward:   26.0 | Running:   20.3
Ep:  998 | Reward:   13.0 | Running:   19.6
Ep:  999 | Reward:   11.0 | Running:   18.7
http://www.xdnf.cn/news/262153.html

相关文章:

  • Oracle OCP认证考试考点详解083系列04
  • 单片机嵌入式按键库
  • Maven安装配置以及Idea中的配置教程
  • C# 操作符
  • 【LeetCode Hot100】栈篇
  • 计算机视觉与深度学习 | 视觉里程计算法综述(传统+深度)
  • 复刻低成本机械臂 SO-ARM100 组装篇(打螺丝喽)
  • firewall docker 冲突问题解决(亲测有效)
  • Windows下编译WebRTC源码
  • [更新完毕]2025东三省C题深圳杯C题数学建模挑战赛数模思路代码文章教学: 分布式能源接入配电网的风险分析
  • AtCoder Beginner Contest 404(ABCDE)
  • 什么是运算符重载
  • word怎么删除空白页?word最后一页删不掉怎么办
  • 基于开源AI大模型与AI智能名片S2B2C商城小程序的线上活动执行优化研究
  • SQL中的Subquery CTE Temporary Table 区别
  • HTTP基础介绍+OSI七层参考模型+HTTP协议介绍
  • 【Elasticsearch】实现气象数据存储与查询系统
  • 总账业务数据——Part 1
  • 单片机嵌入式CAN库
  • 在 Ubuntu 上安装 cPanel
  • 【Qt】初识Qt
  • 【科研绘图系列】R语言绘制世界地图(map plot)
  • 在多线程环境下如何设计共享数据结构保证原子操作与数据一致性
  • 第十章:反击的序曲(续)
  • JavaScript性能优化实战(8):缓存策略与离线优化
  • JavaScript:pc端网页特效--元素偏移量offset系列
  • flask 获取各种请求数据:GET form-data x-www-form-urlencoded JSON headers 上传文件
  • 每天学一个 Linux 命令(35):dos2unix
  • SMT贴片检验标准核心要点与实施规范
  • MySQL进阶(三)