EvanMath
/

new-PPO-LunarLander-v2

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

new-PPO-LunarLander-v2 / PPO-LunarLander-v2 /policy.optimizer.pth

Commit History

PPO trained on 500,000 steps.

e2eaf0e

EvanMath commited on Jul 22, 2022