Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 1059.50 +/- 489.28
       name: mean_reward
       verified: false
 ---
@@ -63,7 +63,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
 OrderedDict([('batch_size', 32),
-             ('buffer_size', 200000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
@@ -72,7 +72,7 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 2000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 719.00 +/- 257.16
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
 OrderedDict([('batch_size', 32),
+             ('buffer_size', 220000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 2500000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 3606913648
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 1308828685
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -2,7 +2,7 @@
 - - - batch_size
     - 32
   - - buffer_size
-    - 200000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 2000000.0
   - - optimize_memory_usage
     - false
   - - policy

 - - - batch_size
     - 32
   - - buffer_size
+    - 220000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
   - - learning_starts
     - 100000
   - - n_timesteps
+    - 2500000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d77e47a2a7379797367fa344648bf74f4086ea4fc3f25085f44379f054b1266
 size 27220313

 version https://git-lfs.github.com/spec/v1
+oid sha256:7dd5ea6b13eb149bc93c0392ac845183ce76be2f6779ef8f1b572c510fd18d46
 size 27220313

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:348d59de91d1a2b1936f31b76a04886ecabbbecd017764c08d6d2adaa1372cf3
 size 13506172

 version https://git-lfs.github.com/spec/v1
+oid sha256:bff5f7f47b1d3ac0aa7ce8e9159e870325008d891c74a37a004809e87f36b0fe
 size 13506172

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:32d0a9918c41da75237895e2396645ae33b44cf7755c09ba0be78d6d7e9276a0
 size 13505370

 version https://git-lfs.github.com/spec/v1
+oid sha256:e05d650c2619d31cc39faf4e6cdec2ca320774c6beff17def44cd4c3ad51620b
 size 13505370

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c50d0d5e7c4d495ddb0717b2aed25352e4da08d4d907cb9b447c6113640b95b
-size 215490

 version https://git-lfs.github.com/spec/v1
+oid sha256:5305fcc4e2a727a36c050813daa553a56fa2e6ef4dd2ee80fd95e20eed76e447
+size 222897

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~1059~~.5, "std_reward": ~~489~~.~~27727312843786~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-09-~~07T07~~:54:42.~~189560~~"}


1	+ {"mean_reward": 719.0, "std_reward": 257.1555949226071, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-09-07T12:41:37.390967"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a91f7fbe9bd2740e0e6e9a79b16ac05094868b60028f456d53b6d0713e1c4733
-size 60231

 version https://git-lfs.github.com/spec/v1
+oid sha256:ecc3487690d1fbd841614571ada06c8402db306c54b953bccdaa9b55487e46df
+size 74208