Files
Serendipity faf0d5ea42 feat: 改进DQN训练稳定性和性能
- 将奖励裁剪替换为奖励缩放,保留奖励大小信号
- 添加学习率调度器,支持warmup和步进衰减
- 增加经验回放缓冲区大小至200,000
- 默认启用Dueling DQN架构
- 优化代码格式和参数传递
- 添加更多训练中间模型保存点
2026-05-02 02:02:17 +08:00

28 lines
256 B
Plaintext

# 操作系统文件
Thumbs.db
.DS_Store
ehthumbs.db
# 编辑器配置
.vscode/
.trae/
.idea/
*.swp
*.swo
*~
# Python (如果有用到)
__pycache__/
*.py[cod]
.env/
.venv/
# 编译输出 (如果有用到C/C++)
*.o
*.exe
*.out
# 模型文件
*.pth
*.pt