rl-atari/强化学习个人项目报告（Atari 游戏方向）/models/dqn_step_1000000.pt at fb09e66d09756e65d30faef82329b21821c9a920

Files

T

Serendipity faf0d5ea42 feat: 改进DQN训练稳定性和性能

- 将奖励裁剪替换为奖励缩放，保留奖励大小信号
- 添加学习率调度器，支持warmup和步进衰减
- 增加经验回放缓冲区大小至200,000
- 默认启用Dueling DQN架构
- 优化代码格式和参数传递
- 添加更多训练中间模型保存点

2026-05-02 02:02:17 +08:00

The file is too large to be shown. View Raw