- 在 .gitignore 文件中添加 .venv/ 目录,以排除 Python 虚拟环境 - 忽略 TensorBoard 生成的二进制日志文件,避免将运行时数据提交到仓库
引入并行环境训练脚本 train_parallel_improved.py,实现多进程并行数据收集 添加奖励塑形包装器,根据速度、赛道位置和完成圈数调整奖励信号 优化神经网络结构和训练参数,包括更大的rollout缓冲区 删除旧的tensorboard日志文件,创建新的训练运行记录