Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 266.00 +/- 95.39
       name: mean_reward
       verified: false
 ---
@@ -57,7 +57,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 32),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
@@ -65,9 +65,9 @@ OrderedDict([('batch_size', 32),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 1e-05),
              ('learning_starts', 100000),
-             ('n_timesteps', 2000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 374.00 +/- 214.89
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 16),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.001),
              ('learning_starts', 100000),
+             ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 2102923977
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 1069349440
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,6 +1,6 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 32
   - - buffer_size
     - 100000
   - - env_wrapper
@@ -14,11 +14,11 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 1.0e-05
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 2000000.0
   - - optimize_memory_usage
     - false
   - - policy

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 16
   - - buffer_size
     - 100000
   - - env_wrapper
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.001
   - - learning_starts
     - 100000
   - - n_timesteps
+    - 1000000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bf6b16fe686eaf6174abb0e83cc03c392536b6a97402412b1412de3b0c101cb3
-size 27224789

 version https://git-lfs.github.com/spec/v1
+oid sha256:0ceaa737a7114cbb5f1191c306bbed863daa9ae826b938d5a5b3846cb59f4638
+size 27224788

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df24b374d3f023a2dd793cab5521ea96cbbe3ed37cd8c3f2e7c4a5a1414df2fc
 size 13505739

 version https://git-lfs.github.com/spec/v1
+oid sha256:375b860e110b7be2f9da38da3f0fe7bcc503a5d007cf2e7ae753dcaf3cf8ec9f
 size 13505739

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:45c5b23804077093208b0ac3b2622fef66925fff1b18005e0b26f29a0772c075
 size 13504937

 version https://git-lfs.github.com/spec/v1
+oid sha256:de3b4f8a1ec2a36d84f01ff7b9e0b6fbfb52154b65ccf7b0fcc1c0be80c200e3
 size 13504937

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dcba93444cb8e9de953d473271591957ac91266c2739fde4d989e1a09ef64150
-size 261557

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b231c3e33922a65189db4066e7414df0b5a66d5fa35017253dc63dd0d43b457
+size 233415

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~266~~.0, "std_reward": 95.~~38867857350787~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-12-~~19T20~~:54:21.~~307944~~"}


1	+ {"mean_reward": 374.0, "std_reward": 214.89299662855464, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-12-19T22:14:07.643212"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0a172b925f04db2da91c5aaeec01990999fae740291053ccae58bba5c45e562e
-size 91041

 version https://git-lfs.github.com/spec/v1
+oid sha256:25471be8f6630682b10afbad6ed662f144cdf126f6abdb4bed4cb6d88dc2fea9
+size 40539