Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 289.00 +/- 149.60
       name: mean_reward
       verified: false
 ---
@@ -62,7 +62,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 32),
              ('buffer_size', 70000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
@@ -70,9 +70,9 @@ OrderedDict([('batch_size', 32),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 200000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 274.50 +/- 31.50
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 64),
              ('buffer_size', 70000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.001),
              ('learning_starts', 100000),
+             ('n_timesteps', 100000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 1252897489
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 3281825993
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,6 +1,6 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 32
   - - buffer_size
     - 70000
   - - env_wrapper
@@ -14,11 +14,11 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.0001
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 200000.0
   - - optimize_memory_usage
     - false
   - - policy

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 64
   - - buffer_size
     - 70000
   - - env_wrapper
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.001
   - - learning_starts
     - 100000
   - - n_timesteps
+    - 100000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9603d8c3a1a68a83c7ebb68c8bef1b050d4a0f3706dc93fc28e090e7b01d6f7
-size 27224803

 version https://git-lfs.github.com/spec/v1
+oid sha256:f6a7419c106fa1860164b24d424da53af0942e44042be900de1f9177e90b5f13
+size 13719746

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:82b7359c840656f03b09d05e9d1eca0ec8d77904db609c1c9e7b498ce63bee04
-size 13505739

 version https://git-lfs.github.com/spec/v1
+oid sha256:1d8d25e1700fa8db131974bc76fc6bd98bdec67fae1809f8c8c0aef0df992089
+size 687

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8264fd2a289de89ff2ba87e0e757c396628ad0d7f66d7f8701eb5cd1de9f5f4d
 size 13504937

 version https://git-lfs.github.com/spec/v1
+oid sha256:37bdf045013f2aa8af45f27253daf035524006c8b75d3aa3a3e75368dfbef32c
 size 13504937

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:69b45095e4c15af49a0cbcadd711be13071884635ba80769d6092a6964a2fe2d
-size 249219

 version https://git-lfs.github.com/spec/v1
+oid sha256:fba2ab7031f7061f065c3d5bc1de3dcfb9536d40b9bccd2413c48c7909f59ea3
+size 261744

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~289~~.0, "std_reward": ~~149~~.~~59612294441322~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-01-~~30T22~~:54:46.~~090403~~"}


1	+ {"mean_reward": 274.5, "std_reward": 31.5, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-01-30T23:01:15.240333"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8e2a25e7daeb986d5a09a6b44897286d0c8e14886f49de214a9bc2143e8198ae
-size 9759

 version https://git-lfs.github.com/spec/v1
+oid sha256:b311c0e9bda07e6fc9c17a578efe773aa2666e7f28b3847bc8d58c135c506f65
+size 5820