rl-atari

Serendipity/rl-atari

Fork 0

Commit Graph

Author	SHA1	Message	Date
Serendipity	85f912483a	refactor(agent): 重命名 train_step 为 step_count 以提高可读性 - 将 agent.py 中的 train_step 变量重命名为 step_count，使其含义更清晰 - 更新所有相关引用，包括 epsilon 衰减和目标网络更新逻辑 - 同步修改模型保存和加载时的键名 - 修复多个源文件末尾的换行符问题	2026-05-01 10:19:14 +08:00
Serendipity	e8b51240f9	feat: 添加DQN强化学习项目框架和核心实现实现完整的DQN算法框架，用于Atari Space Invaders游戏训练。包括： - QNetwork和DuelingQNetwork神经网络架构 - 经验回放缓冲区（标准和优先级版本） - DQN智能体实现ε-greedy策略和Double DQN - 环境包装器（灰度化、调整大小、帧堆叠等） - 训练器、评估脚本和图表生成工具 - 详细的项目文档和依赖配置	2026-05-01 10:01:12 +08:00
Serendipity	cdec40a7c7	docs: 添加课程资料与更新作业要求文档添加 Lecture4-6 课件 PDF 与课程作业要求 PDF 至文档目录更新外教课原文要求，仅保留 Atari 游戏项目要求将完整作业要求文档移动至强化学习项目报告目录	2026-05-01 09:47:09 +08:00

Author

SHA1

Message

Date

Serendipity

85f912483a

refactor(agent): 重命名 train_step 为 step_count 以提高可读性

- 将 agent.py 中的 train_step 变量重命名为 step_count，使其含义更清晰
- 更新所有相关引用，包括 epsilon 衰减和目标网络更新逻辑
- 同步修改模型保存和加载时的键名
- 修复多个源文件末尾的换行符问题

2026-05-01 10:19:14 +08:00

Serendipity

e8b51240f9

feat: 添加DQN强化学习项目框架和核心实现

实现完整的DQN算法框架，用于Atari Space Invaders游戏训练。包括：
- QNetwork和DuelingQNetwork神经网络架构
- 经验回放缓冲区（标准和优先级版本）
- DQN智能体实现ε-greedy策略和Double DQN
- 环境包装器（灰度化、调整大小、帧堆叠等）
- 训练器、评估脚本和图表生成工具
- 详细的项目文档和依赖配置

2026-05-01 10:01:12 +08:00

Serendipity

cdec40a7c7

docs: 添加课程资料与更新作业要求文档

添加 Lecture4-6 课件 PDF 与课程作业要求 PDF 至文档目录
更新外教课原文要求，仅保留 Atari 游戏项目要求
将完整作业要求文档移动至强化学习项目报告目录

2026-05-01 09:47:09 +08:00

3 Commits