Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: MsPacmanNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 2043.00 +/- 1029.09
       name: mean_reward
       verified: false
 ---
@@ -62,7 +62,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env MsPacmanNoFrameskip-v4 -f logs/ -
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 32),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
@@ -72,7 +72,7 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: MsPacmanNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 1816.00 +/- 301.64
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 64),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 2000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 1077733471
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 4016104834
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,6 +1,6 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 32
   - - buffer_size
     - 100000
   - - env_wrapper
@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 1000000.0
   - - optimize_memory_usage
     - false
   - - policy

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 64
   - - buffer_size
     - 100000
   - - env_wrapper
   - - learning_starts
     - 100000
   - - n_timesteps
+    - 2000000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-MsPacmanNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:721c5b5804d6755c193b0683a25f477aefdc9546de048ddcfd0ff01b506e2c80
 size 27244694

 version https://git-lfs.github.com/spec/v1
+oid sha256:bdb32c7be7fe1689cac2b946471f25455ecbddc7c24d68e2a7a4b16e364971cb
 size 27244694

dqn-MsPacmanNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-MsPacmanNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd6ef282ed40f4f160c62a80d0a8ab451bed85a0f58c276f728090e834e1c657
 size 13518524

 version https://git-lfs.github.com/spec/v1
+oid sha256:bf7f927126ceef9e78e7086f11e69f2dee1aa4ec3931ced8eb67db4a755ef662
 size 13518524

dqn-MsPacmanNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92820804e6dc1925e645cbbeedd9b025d08ffe1ce7d692a48f90970fcc4413af
 size 13517658

 version https://git-lfs.github.com/spec/v1
+oid sha256:220ef7b81217abaa7b3ae10143fec540864e0d84ff56e0e82bf49a02879ffd2f
 size 13517658

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:69448889872c572a2b76a0e4897d9bcf214de1e11e64d5626da2a144f1cc7e9e
-size 242079

 version https://git-lfs.github.com/spec/v1
+oid sha256:c8e04077556de7962ff2c9091315d1e0bbd177e02c85eca838277d9e8ea3d0e7
+size 249665

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~2043~~.0, "std_reward": ~~1029~~.~~0874598400273~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-11-~~21T22~~:04:30.~~844859~~"}


1	+ {"mean_reward": 1816.0, "std_reward": 301.6355416723964, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-11-23T12:11:23.971229"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a457c1f6464572c3fb6532227a56d3c4f1a05c202aad18c863aedb0b7611607
-size 42268

 version https://git-lfs.github.com/spec/v1
+oid sha256:80da0c7e420545285ea0f138f04fb55fc9dc65e2fffa7ed8aa95cce320c98a9f
+size 72334