Push agent to the Hub

Files changed (4) hide show

README.md CHANGED Viewed

@@ -1,31 +1,31 @@
 ---
 tags:
-- PandaReachDense-v3
 - ppo
 - deep-reinforcement-learning
 - reinforcement-learning
 - custom-implementation
 - deep-rl-course
 model-index:
-- name: Actor-Critic
   results:
   - task:
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
-      name: PandaReachDense-v3
-      type: PandaReachDense-v3
     metrics:
     - type: mean_reward
-      value: -0.17 +/- 0.06
       name: mean_reward
       verified: false
 ---
-  # Actor-Critic Agent Playing PandaReachDense-v3
-  This is a trained model of an AC agent playing PandaReachDense-v3.
   # Hyperparameters
-  hp_seed: 2444<br />hp_torch_deterministic: True<br />hp_total_timesteps: 20500<br />hp_critic_nstep: 1<br />hp_num_envs: 12<br />hp_learning_rate_actor: 0.001<br />hp_learning_rate_critic: 0.005<br />hp_minlr_actor: 2e-06<br />hp_minlr_critic: 1e-05<br />hp_gamma: 0.99<br />hp_reg_term: 3<br />hp_batch_size: 64

 ---
 tags:
+- Pixelcopter-PLE-v0
 - ppo
 - deep-reinforcement-learning
 - reinforcement-learning
 - custom-implementation
 - deep-rl-course
 model-index:
+- name: SARSA_QLEARNING
   results:
   - task:
       type: reinforcement-learning
       name: reinforcement-learning
     dataset:
+      name: Pixelcopter-PLE-v0
+      type: Pixelcopter-PLE-v0
     metrics:
     - type: mean_reward
+      value: 49.30 +/- 37.85
       name: mean_reward
       verified: false
 ---
+  # REINFORCE Agent Playing Pixelcopter-PLE-v0
+  This is a trained model of a REINFORCE agent playing Pixelcopter-PLE-v0.
   # Hyperparameters
+  hp_seed: 1<br />hp_torch_deterministic: True<br />hp_nb_frames: 8<br />hp_total_timesteps: 1005000<br />hp_learning_t: 500<br />hp_num_envs: 12<br />hp_learning_rate: 0.0001<br />hp_gamma: 0.99<br />hp_buffer_size: 10000<br />hp_batch_size: 32

model_scripted.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c0afad2afd781a1dfcf0f0bfa7274986dc8bbbc6eb37a732dc958dc799080cf4
-size 34816

 version https://git-lfs.github.com/spec/v1
+oid sha256:bea2dc5275339fbb101b04eba7d996be154b35cebac4967a8eb26fa1134f171c
+size 1186823

replay.mp4 CHANGED Viewed

Binary files a/replay.mp4 and b/replay.mp4 differ

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"env_id": "~~PandaReachDense~~-v3", "mean_reward": ~~"-0~~.~~1670995"~~, "std_reward": "0.~~05625326"~~, "n_evaluation_episodes": 10, "eval_datetime": "2024-04-~~01T13~~:23:29.~~887964~~"}


1	+ {"env_id": "Pixelcopter-PLE-v0", "mean_reward": 49.3, "std_reward": 37.84983487414443, "n_evaluation_episodes": 10, "eval_datetime": "2024-04-01T22:25:28.056818"}