paprae
/

ppo-LunarLander-v2

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

paprae commited on Feb 16, 2023

Commit

c223161

•

1 Parent(s): 6b0247e

Create LunarLander-v2

Files changed (1) hide show

LunarLander-v2 +35 -0

LunarLander-v2 ADDED Viewed

	@@ -0,0 +1,35 @@

+1) model = PPO(policy = "MlpPolicy",
+            env = env,
+            n_steps = 1024,
+            batch_size = 64,
+            n_epochs = 4,
+            gamma = 0.999,
+            gae_lambda = 0.98,
+            ent_coef = 0.01,
+            verbose=1)
+model.learn(total_timesteps = 500000)
+mean_reward=193.60 +/- 21.32519973099738
+2) model = PPO(policy = "MlpPolicy",
+            env = env,
+            n_steps = 1024,
+            batch_size = 64,
+            n_epochs = 8,
+            gamma = 0.999,
+            gae_lambda = 0.98,
+            ent_coef = 0.01,
+            verbose=1)
+model.learn(total_timesteps = 500000)
+mean_reward=235.09 +/- 21.878789192117072
+3) model = PPO(policy = "MlpPolicy",
+            env = env,
+            n_steps = 1024,
+            batch_size = 64,
+            n_epochs = 8,
+            gamma = 0.999,
+            gae_lambda = 0.98,
+            ent_coef = 0.01,
+            verbose=1)
+model.learn(total_timesteps = 1000000)