- 将 agent.py 中的 train_step 变量重命名为 step_count,使其含义更清晰 - 更新所有相关引用,包括 epsilon 衰减和目标网络更新逻辑 - 同步修改模型保存和加载时的键名 - 修复多个源文件末尾的换行符问题
实现完整的DQN算法框架,用于Atari Space Invaders游戏训练。包括: - QNetwork和DuelingQNetwork神经网络架构 - 经验回放缓冲区(标准和优先级版本) - DQN智能体实现ε-greedy策略和Double DQN - 环境包装器(灰度化、调整大小、帧堆叠等) - 训练器、评估脚本和图表生成工具 - 详细的项目文档和依赖配置
添加 Lecture4-6 课件 PDF 与课程作业要求 PDF 至文档目录 更新外教课原文要求,仅保留 Atari 游戏项目要求 将完整作业要求文档移动至强化学习项目报告目录