faf0d5ea42
- 将奖励裁剪替换为奖励缩放,保留奖励大小信号 - 添加学习率调度器,支持warmup和步进衰减 - 增加经验回放缓冲区大小至200,000 - 默认启用Dueling DQN架构 - 优化代码格式和参数传递 - 添加更多训练中间模型保存点
28 lines
256 B
Plaintext
28 lines
256 B
Plaintext
# 操作系统文件
|
|
Thumbs.db
|
|
.DS_Store
|
|
ehthumbs.db
|
|
|
|
# 编辑器配置
|
|
.vscode/
|
|
.trae/
|
|
.idea/
|
|
*.swp
|
|
*.swo
|
|
*~
|
|
|
|
# Python (如果有用到)
|
|
__pycache__/
|
|
*.py[cod]
|
|
.env/
|
|
.venv/
|
|
|
|
# 编译输出 (如果有用到C/C++)
|
|
*.o
|
|
*.exe
|
|
*.out
|
|
|
|
# 模型文件
|
|
*.pth
|
|
*.pt
|