Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 90.50 +/- 51.16
       name: mean_reward
       verified: false
 ---
@@ -62,16 +62,16 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 32),
-             ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.0001),
-             ('learning_starts', 10000),
              ('n_timesteps', 100000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 275.50 +/- 83.08
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 64),
+             ('buffer_size', 150000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.0005),
+             ('learning_starts', 100000),
              ('n_timesteps', 100000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 3797466460
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 480977459
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,8 +1,8 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 32
   - - buffer_size
-    - 100000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
@@ -14,9 +14,9 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.0001
   - - learning_starts
-    - 10000
   - - n_timesteps
     - 100000.0
   - - optimize_memory_usage

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 64
   - - buffer_size
+    - 150000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.0005
   - - learning_starts
+    - 100000
   - - n_timesteps
     - 100000.0
   - - optimize_memory_usage

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db89135e6dd26a7c3ec09a70bb7c426ef4047d055f7e6046e7e245dd4a4f4339
-size 27224801

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4277292723247c13f8b722525490f494df617d9811152fa98baf3e290f62329
+size 13719746

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5fd3e1f595a7d4e1ee15084257910521818c8fdf44dcea9277e6e01ee381c64c
-size 13505739

 version https://git-lfs.github.com/spec/v1
+oid sha256:806804ebabef9eec640330a6472ba384103459468f2ea3a2c8ffde2197d45835
+size 687

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a6b7ed668ba626cddacf11db894de9f7647c1a1576f86afca0d0e2942eb505ac
 size 13504937

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ba1e71f156fbc9f9de3a0153420f114e9759ac99a297e9e95d4892f501b5021
 size 13504937

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:30e538f92b94c907f5569da67e56b8039edebc5d974039f3468067c777795401
-size 258972

 version https://git-lfs.github.com/spec/v1
+oid sha256:caa6a1f28e357785d754b2769d1539f69db8d8cc9b953475f14f2f15f30761f4
+size 263235

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": 90.5, "std_reward": 51.~~15906566777779~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-02-~~08T11~~:42:42.~~004942~~"}


1	+ {"mean_reward": 275.5, "std_reward": 83.07978093375065, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-02-14T08:40:14.882651"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b7ef98e8b8aef95933859b80021be6c9c0b32bb64a5ce9a17fc452b737fae467
-size 5183

 version https://git-lfs.github.com/spec/v1
+oid sha256:04ac3e09bb9161128c5eb1129748089f2656d6e0866cac809766e43d18f76a25
+size 5798