feat: 添加并行训练脚本和奖励塑形以改进PPO性能 · 7dea00195e - rl-atari - Serendipity

Serendipity/rl-atari

feat: 添加并行训练脚本和奖励塑形以改进PPO性能

引入并行环境训练脚本 train_parallel_improved.py，实现多进程并行数据收集
添加奖励塑形包装器，根据速度、赛道位置和完成圈数调整奖励信号
优化神经网络结构和训练参数，包括更大的rollout缓冲区
删除旧的tensorboard日志文件，创建新的训练运行记录

This commit is contained in:

刘航宇

2026-05-01 09:26:39 +08:00

parent d6860f1f15

commit 7dea00195e

12 changed files with 662 additions and 0 deletions

强化学习个人项目报告/logs/tensorboard/run_improved_1777558107/events.out.tfevents.1777558107.LHY.48412.0

BIN

View File

Binary file not shown.

强化学习个人项目报告/logs/tensorboard/run_improved_1777564565/events.out.tfevents.1777564565.LHY.35368.0

BIN

View File

Binary file not shown.

强化学习个人项目报告/logs/tensorboard/run_improved_1777564802/events.out.tfevents.1777564802.LHY.39456.0

BIN

View File

Binary file not shown.

强化学习个人项目报告/logs/tensorboard/run_improved_1777568942/events.out.tfevents.1777568942.LHY.41354.0

BIN

View File

Binary file not shown.

强化学习个人项目报告/logs/tensorboard/run_parallel_1777561439/events.out.tfevents.1777561439.LHY.16748.0

BIN

View File

Binary file not shown.

强化学习个人项目报告/logs/tensorboard/run_parallel_1777566661/events.out.tfevents.1777566661.LHY.3190.0

BIN

View File

Binary file not shown.

强化学习个人项目报告/logs/tensorboard/run_parallel_improved_1777570209/events.out.tfevents.1777570209.LHY.74809.0

BIN

View File

Binary file not shown.

强化学习个人项目报告/logs/tensorboard/run_parallel_improved_1777570331/events.out.tfevents.1777570331.LHY.79036.0

BIN

View File

Binary file not shown.