rl-atari

Author	SHA1	Message	Date
Serendipity	79ffb90823	feat: 优化DQN训练配置并支持Dueling网络评估 - 将学习率调整为5e-5，批次大小增加到64，经验回放缓冲区扩大到500,000 - 启用优先经验回放，调整目标网络更新频率为1000步 - 评估时使用Dueling网络架构，训练时评估模式的ε设为0 - 更新评估结果以反映配置改进后的性能变化	2026-05-02 11:36:12 +08:00
Serendipity	1c1cccd3f6	feat: 添加模型评估脚本并更新实验报告 - 添加 evaluate_checkpoints.py 脚本，用于评估训练过程中的检查点模型 - 更新 generate_plots.py 以支持从真实评估结果生成图表 - 更新实验报告内容，包含具体实验结果数据和分析 - 添加中文支持并更新作者信息 - 生成评估结果JSON文件和相应图表	2026-05-01 18:44:22 +08:00

Author

SHA1

Message

Date

79ffb90823

feat: 优化DQN训练配置并支持Dueling网络评估

- 将学习率调整为5e-5，批次大小增加到64，经验回放缓冲区扩大到500,000
- 启用优先经验回放，调整目标网络更新频率为1000步
- 评估时使用Dueling网络架构，训练时评估模式的ε设为0
- 更新评估结果以反映配置改进后的性能变化

2026-05-02 11:36:12 +08:00

1c1cccd3f6

feat: 添加模型评估脚本并更新实验报告

- 添加 evaluate_checkpoints.py 脚本，用于评估训练过程中的检查点模型
- 更新 generate_plots.py 以支持从真实评估结果生成图表
- 更新实验报告内容，包含具体实验结果数据和分析
- 添加中文支持并更新作者信息
- 生成评估结果JSON文件和相应图表

2026-05-01 18:44:22 +08:00