Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -10,7 +10,7 @@ model-index:
   results:
   - metrics:
     - type: mean_reward
-      value: 374.00 +/- 214.89
       name: mean_reward
     task:
       type: reinforcement-learning
@@ -67,7 +67,7 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 200000),
-             ('n_timesteps', 10000.0),
              ('normalize', False),
              ('optimize_memory_usage', True),
              ('policy', 'CnnPolicy'),

   results:
   - metrics:
     - type: mean_reward
+      value: 1295.00 +/- 492.10
       name: mean_reward
     task:
       type: reinforcement-learning
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 200000),
+             ('n_timesteps', 10000000.0),
              ('normalize', False),
              ('optimize_memory_usage', True),
              ('policy', 'CnnPolicy'),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 1375423501
   - - storage
     - null
   - - study_name
@@ -72,7 +72,7 @@
   - - vec_env
     - dummy
   - - verbose
-    - 1
   - - wandb_entity
     - null
   - - wandb_project_name

   - - save_replay_buffer
     - false
   - - seed
+    - 4248638377
   - - storage
     - null
   - - study_name
   - - vec_env
     - dummy
   - - verbose
+    - 0
   - - wandb_entity
     - null
   - - wandb_project_name

config.yml CHANGED Viewed

@@ -20,7 +20,7 @@
   - - learning_starts
     - 200000
   - - n_timesteps
-    - 10000.0
   - - normalize
     - false
   - - optimize_memory_usage

   - - learning_starts
     - 200000
   - - n_timesteps
+    - 10000000.0
   - - normalize
     - false
   - - optimize_memory_usage

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27f951f8f3f5f6d3a4fc0f1ac4057e49ecc67a92e6ccfaa05c3ce4651c83be07
-size 13716431

 version https://git-lfs.github.com/spec/v1
+oid sha256:63887a1cfa7666a5cf42743f4cba5d9fdfd2da44ae24f6fb9432092181f4375f
+size 27224849

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f1e067afe9912f3dd1b7925918b8cbe439229f6008e572c9c7e431ae731419f1
-size 687

 version https://git-lfs.github.com/spec/v1
+oid sha256:a64f47f91aa7ef294ea9ee161cdf2e8c67d80097e82c641fca071e1a17b3a4e5
+size 13505739

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c8e5f8d4448e066e274c79fb49d46d2ebf9ad1bb034d013f01f286be5563f98d
 size 13504937

 version https://git-lfs.github.com/spec/v1
+oid sha256:36d3d1285b924bff6033612a1a92582abb1cfd807e0753354adef231b2f6fecb
 size 13504937

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0d34ed105eab5ee73699dbb8875f126b9b92306bf6863b1e4f282176699efe65
-size 234682

 version https://git-lfs.github.com/spec/v1
+oid sha256:df9c9e1c9de793c32ac1c59c0f58ad73a354123bfcb7594df3f915c26d8e85c8
+size 192587

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~374~~.0, "std_reward": ~~214~~.~~89299662855464~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-12-~~24T00~~:16:51.~~830706~~"}


1	+ {"mean_reward": 1295.0, "std_reward": 492.09755130461684, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-12-24T11:58:59.694203"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fec6c5bfd75114c877a3712ed60ff73aa2fd8f66192813967d44aae22416f302
-size 600

 version https://git-lfs.github.com/spec/v1
+oid sha256:a57e6ac55818215f2397713973650272eff28049f8147e859419e0415dc11ce9
+size 272504