Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 329.00 +/- 157.97
       name: mean_reward
       verified: false
 ---
@@ -62,7 +62,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 32),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
@@ -70,9 +70,9 @@ OrderedDict([('batch_size', 32),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.001),
              ('learning_starts', 100000),
-             ('n_timesteps', 10000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 546.50 +/- 74.57
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 64),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 5000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 3892253428
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 807179529
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,6 +1,6 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 32
   - - buffer_size
     - 100000
   - - env_wrapper
@@ -14,11 +14,11 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.001
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 10000000.0
   - - optimize_memory_usage
     - false
   - - policy

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 64
   - - buffer_size
     - 100000
   - - env_wrapper
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.0001
   - - learning_starts
     - 100000
   - - n_timesteps
+    - 5000000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:270d4a65851873813f357041b314ac3d95d9a405be0eb433d4531b6ae1fc2055
-size 27220214

 version https://git-lfs.github.com/spec/v1
+oid sha256:1c4487e6437aa4a3801989af5b347f366943e78ae044726c9f121acd839b2260
+size 27220212

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9e5f4bf4f26db124841461ce7f159486fba486501747db97128691a81bd9e646
 size 13506236

 version https://git-lfs.github.com/spec/v1
+oid sha256:026b1389a11eb431446311cac58dc26e91b28d9c6d7d2a1c89876f00bbd80657
 size 13506236

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0272834830281f42ada55f645c11cf3cc1a09f50fb40921c4a23c8f458d1951d
 size 13505370

 version https://git-lfs.github.com/spec/v1
+oid sha256:988ba3ad032282221215ba32f6df73c2007c237bcb4c4e96acfbb81670542f8a
 size 13505370

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d1220fd2663a829192a2b709c767eb2debf32246e6f8d3b5838a5840975ff8d0
-size 242623

 version https://git-lfs.github.com/spec/v1
+oid sha256:8222027f2768f16b13d096ba0915d31c7f96227c77a159b02a171ce390991606
+size 217143

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~329~~.0, "std_reward": ~~157~~.~~96835126062436~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-02-~~14T05~~:45:46.~~388014~~"}


1	+ {"mean_reward": 546.5, "std_reward": 74.56708389095017, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-02-20T20:41:24.867805"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:63fe9e5298383ddcf8e486cc09f027cb531096f40033311ded28b9ab0cb3b2ca
-size 48042

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0d08791834d844acbfd54b12ad02bc79adaf597acadc31f3d59cab8d9ab9e41
+size 31141