rl-atari/强化学习个人项目报告/models/ppo_improved_final.pt at 6b929e9790c4965e28f224d51d2645d6ed418ee1

Files

T

Serendipity 6b929e9790 docs: 添加强化学习项目报告及相关文件

添加完整的强化学习个人项目报告，包括PDF文档、LaTeX源文件、训练曲线图、TensorBoard日志以及改进的训练脚本。报告详细记录了从零实现PPO算法解决CarRacing-v3环境的过程，包含算法设计、网络架构、超参数配置和实验结果分析。

2026-04-30 22:59:14 +08:00

The file is too large to be shown. View Raw