shivr
/

PPO-LunarLander-v2

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

PPO-LunarLander-v2 / replay.mp4

Commit History

Initial PPO model on 1000000 training steps

ad41807

shivr commited on May 24, 2022