这个仓库目前包含两个本地强化学习迷宫实验项目:
ai-maze-lab/:轻量 Q-learning + NumPy + Pygame 版本,包含训练日志、曲线、热力图、钥匙和门规则,以及 macOS 双击启动包装。ai-maze-ppo-lab/:局部小网格观察 + Gymnasium + Stable-Baselines3/sb3-contrib PPO 版本,用 Recurrent CNN PPO 训练更通用的迷宫策略网络;界面分为训练场和试验场,也包含 macOS 双击启动包装。
Q-learning 版本:
cd ai-maze-lab
python main.py --map maps/level_1.txtPPO 版本:
cd ai-maze-ppo-lab
python train_ppo.py --timesteps 500000 --n-envs 4 --random-maps 200 --ent-coef 0.03 --view-range 3 --view-width 3 --random-rows 11 --random-cols 15 --wall-density 0.12 --trap-density 0.04PPO 图形界面:
cd ai-maze-ppo-lab
python ppo_app.py具体安装和运行方式见各子项目内的 README.md。
