Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 275.50 +/- 83.08
       name: mean_reward
       verified: false
 ---
@@ -62,7 +62,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 64),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
@@ -70,9 +70,9 @@ OrderedDict([('batch_size', 64),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.001),
              ('learning_starts', 100000),
-             ('n_timesteps', 200000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 442.00 +/- 104.62
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 32),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.0003),
              ('learning_starts', 100000),
+             ('n_timesteps', 500000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 2202336912
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 2797509801
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,6 +1,6 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 64
   - - buffer_size
     - 100000
   - - env_wrapper
@@ -14,11 +14,11 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.001
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 200000.0
   - - optimize_memory_usage
     - false
   - - policy

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 32
   - - buffer_size
     - 100000
   - - env_wrapper
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.0003
   - - learning_starts
     - 100000
   - - n_timesteps
+    - 500000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5475bcfacde9b3b5bb63a85f26b9b32e0c42afd3116e10e2e1c9e759613de8fd
-size 27225241

 version https://git-lfs.github.com/spec/v1
+oid sha256:aa3d2717876372c51eeff72583d2bcbb992d4bc3cd4cd575959f10bd6950b856
+size 27225242

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cab278d18a9c1eb0c98c625d9d92e4ecaefa2a0390762ac5b00698f663d222b3
 size 13505739

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ffbe428dd915e0b23fdb0157e75b3f884c2b86ed75be4ce94859c833a6856b3
 size 13505739

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:117e90859d3cecc8f3374d1150d8022ecca14e6cf1c5ec2774260ff31fcc9d6c
 size 13504937

 version https://git-lfs.github.com/spec/v1
+oid sha256:303a43089c99693bd77a203500ac038b123819cdb61c526a45bf8079aca1d57b
 size 13504937

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d255c9b1aa7bf77e2c0d0752f8c8dddaf52c4b372917a0b3a284c003dd687d08
-size 263020

 version https://git-lfs.github.com/spec/v1
+oid sha256:a15cf293ee8c9660f0112a68d713d636017822b37f0560a51f581db32d838f45
+size 258322

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~275~~.5, "std_reward": 83.~~07978093375065~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-03-~~17T18~~:46:32.~~815591~~"}


1	+ {"mean_reward": 442.0, "std_reward": 104.62313319720452, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-03-17T19:13:39.401748"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d1e6f0765b8c069a0015642ebfd59c828ee5303a5b68c77de397a86656ec8543
-size 9349

 version https://git-lfs.github.com/spec/v1
+oid sha256:b31393649233a3860c21671cd4e0f8f0fac96e0541f6b28a138cfc09a01d4b4c
+size 19796