Cheekydave
/

PPO-LL2

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

PPO-LL2 / ppo-LunarLander-v2_01 /policy.optimizer.pth

Commit History

PPO model trained on 5m steps

2d40278
verified

Cheekydave commited on Apr 23