diff --git "a/sf_log.txt" "b/sf_log.txt"
new file mode 100644--- /dev/null
+++ "b/sf_log.txt"
@@ -0,0 +1,8430 @@
+[2023-03-09 14:30:16,317][744089] Saving configuration to /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/config.json...
+[2023-03-09 14:30:16,333][744089] Rollout worker 0 uses device cpu
+[2023-03-09 14:30:16,333][744089] Rollout worker 1 uses device cpu
+[2023-03-09 14:30:16,333][744089] Rollout worker 2 uses device cpu
+[2023-03-09 14:30:16,333][744089] Rollout worker 3 uses device cpu
+[2023-03-09 14:30:16,333][744089] Rollout worker 4 uses device cpu
+[2023-03-09 14:30:16,334][744089] Rollout worker 5 uses device cpu
+[2023-03-09 14:30:16,334][744089] Rollout worker 6 uses device cpu
+[2023-03-09 14:30:16,334][744089] Rollout worker 7 uses device cpu
+[2023-03-09 14:30:16,334][744089] In synchronous mode, we only accumulate one batch. Setting num_batches_to_accumulate to 1
+[2023-03-09 14:30:16,346][744089] InferenceWorker_p0-w0: min num requests: 2
+[2023-03-09 14:30:16,365][744089] Starting all processes...
+[2023-03-09 14:30:16,365][744089] Starting process learner_proc0
+[2023-03-09 14:30:16,415][744089] Starting all processes...
+[2023-03-09 14:30:16,473][744089] Starting process inference_proc0-0
+[2023-03-09 14:30:16,483][744089] Starting process rollout_proc0
+[2023-03-09 14:30:16,484][744089] Starting process rollout_proc1
+[2023-03-09 14:30:16,484][744089] Starting process rollout_proc2
+[2023-03-09 14:30:16,484][744089] Starting process rollout_proc3
+[2023-03-09 14:30:16,484][744089] Starting process rollout_proc4
+[2023-03-09 14:30:16,485][744089] Starting process rollout_proc5
+[2023-03-09 14:30:16,485][744089] Starting process rollout_proc6
+[2023-03-09 14:30:16,487][744089] Starting process rollout_proc7
+[2023-03-09 14:30:18,083][744405] Worker 2 uses CPU cores [8, 9, 10, 11]
+[2023-03-09 14:30:18,095][744358] Starting seed is not provided
+[2023-03-09 14:30:18,096][744358] Initializing actor-critic model on device cpu
+[2023-03-09 14:30:18,096][744358] RunningMeanStd input shape: (39,)
+[2023-03-09 14:30:18,096][744358] RunningMeanStd input shape: (1,)
+[2023-03-09 14:30:18,188][744358] Created Actor Critic model with architecture:
+[2023-03-09 14:30:18,188][744358] ActorCriticSharedWeights(
+  (obs_normalizer): ObservationNormalizer(
+    (running_mean_std): RunningMeanStdDictInPlace(
+      (running_mean_std): ModuleDict(
+        (obs): RunningMeanStdInPlace()
+      )
+    )
+  )
+  (returns_normalizer): RecursiveScriptModule(original_name=RunningMeanStdInPlace)
+  (encoder): MultiInputEncoder(
+    (encoders): ModuleDict(
+      (obs): MlpEncoder(
+        (mlp_head): RecursiveScriptModule(
+          original_name=Sequential
+          (0): RecursiveScriptModule(original_name=Linear)
+          (1): RecursiveScriptModule(original_name=Tanh)
+          (2): RecursiveScriptModule(original_name=Linear)
+          (3): RecursiveScriptModule(original_name=Tanh)
+        )
+      )
+    )
+  )
+  (core): ModelCoreIdentity()
+  (decoder): MlpDecoder(
+    (mlp): Identity()
+  )
+  (critic_linear): Linear(in_features=64, out_features=1, bias=True)
+  (action_parameterization): ActionParameterizationContinuousNonAdaptiveStddev(
+    (distribution_linear): Linear(in_features=64, out_features=4, bias=True)
+  )
+)
+[2023-03-09 14:30:18,216][744502] Worker 6 uses CPU cores [24, 25, 26, 27]
+[2023-03-09 14:30:18,349][744438] Worker 4 uses CPU cores [16, 17, 18, 19]
+[2023-03-09 14:30:18,379][744404] Worker 1 uses CPU cores [4, 5, 6, 7]
+[2023-03-09 14:30:18,479][744534] Worker 7 uses CPU cores [28, 29, 30, 31]
+[2023-03-09 14:30:18,571][744358] Using optimizer <class 'torch.optim.adam.Adam'>
+[2023-03-09 14:30:18,572][744358] No checkpoints found
+[2023-03-09 14:30:18,572][744358] Did not load from checkpoint, starting from scratch!
+[2023-03-09 14:30:18,572][744358] Initialized policy 0 weights for model version 0
+[2023-03-09 14:30:18,573][744358] LearnerWorker_p0 finished initialization!
+[2023-03-09 14:30:18,604][744470] Worker 5 uses CPU cores [20, 21, 22, 23]
+[2023-03-09 14:30:18,696][744402] RunningMeanStd input shape: (39,)
+[2023-03-09 14:30:18,697][744402] RunningMeanStd input shape: (1,)
+[2023-03-09 14:30:18,768][744089] Inference worker 0-0 is ready!
+[2023-03-09 14:30:18,769][744089] All inference workers are ready! Signal rollout workers to start!
+[2023-03-09 14:30:18,775][744403] Worker 0 uses CPU cores [0, 1, 2, 3]
+[2023-03-09 14:30:18,853][744406] Worker 3 uses CPU cores [12, 13, 14, 15]
+[2023-03-09 14:30:18,995][744089] Fps is (10 sec: nan, 60 sec: nan, 300 sec: nan). Total num frames: 0. Throughput: 0: nan. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
+[2023-03-09 14:30:22,785][744438] Decorrelating experience for 0 frames...
+[2023-03-09 14:30:22,790][744404] Decorrelating experience for 0 frames...
+[2023-03-09 14:30:22,790][744470] Decorrelating experience for 0 frames...
+[2023-03-09 14:30:22,798][744438] Decorrelating experience for 64 frames...
+[2023-03-09 14:30:22,803][744404] Decorrelating experience for 64 frames...
+[2023-03-09 14:30:22,803][744470] Decorrelating experience for 64 frames...
+[2023-03-09 14:30:22,804][744405] Decorrelating experience for 0 frames...
+[2023-03-09 14:30:22,815][744502] Decorrelating experience for 0 frames...
+[2023-03-09 14:30:22,818][744405] Decorrelating experience for 64 frames...
+[2023-03-09 14:30:22,822][744403] Decorrelating experience for 0 frames...
+[2023-03-09 14:30:22,828][744502] Decorrelating experience for 64 frames...
+[2023-03-09 14:30:22,835][744403] Decorrelating experience for 64 frames...
+[2023-03-09 14:30:22,837][744438] Decorrelating experience for 128 frames...
+[2023-03-09 14:30:22,841][744404] Decorrelating experience for 128 frames...
+[2023-03-09 14:30:22,842][744470] Decorrelating experience for 128 frames...
+[2023-03-09 14:30:22,844][744534] Decorrelating experience for 0 frames...
+[2023-03-09 14:30:22,856][744405] Decorrelating experience for 128 frames...
+[2023-03-09 14:30:22,857][744534] Decorrelating experience for 64 frames...
+[2023-03-09 14:30:22,867][744502] Decorrelating experience for 128 frames...
+[2023-03-09 14:30:22,874][744403] Decorrelating experience for 128 frames...
+[2023-03-09 14:30:22,897][744534] Decorrelating experience for 128 frames...
+[2023-03-09 14:30:22,901][744438] Decorrelating experience for 192 frames...
+[2023-03-09 14:30:22,905][744404] Decorrelating experience for 192 frames...
+[2023-03-09 14:30:22,906][744470] Decorrelating experience for 192 frames...
+[2023-03-09 14:30:22,920][744405] Decorrelating experience for 192 frames...
+[2023-03-09 14:30:22,931][744502] Decorrelating experience for 192 frames...
+[2023-03-09 14:30:22,938][744403] Decorrelating experience for 192 frames...
+[2023-03-09 14:30:22,961][744534] Decorrelating experience for 192 frames...
+[2023-03-09 14:30:23,995][744089] Fps is (10 sec: 0.0, 60 sec: 0.0, 300 sec: 0.0). Total num frames: 0. Throughput: 0: 0.0. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
+[2023-03-09 14:30:24,057][744406] Decorrelating experience for 0 frames...
+[2023-03-09 14:30:24,071][744406] Decorrelating experience for 64 frames...
+[2023-03-09 14:30:24,114][744406] Decorrelating experience for 128 frames...
+[2023-03-09 14:30:24,215][744406] Decorrelating experience for 192 frames...
+[2023-03-09 14:30:26,883][744404] Decorrelating experience for 256 frames...
+[2023-03-09 14:30:26,901][744438] Decorrelating experience for 256 frames...
+[2023-03-09 14:30:26,903][744470] Decorrelating experience for 256 frames...
+[2023-03-09 14:30:26,909][744405] Decorrelating experience for 256 frames...
+[2023-03-09 14:30:26,913][744502] Decorrelating experience for 256 frames...
+[2023-03-09 14:30:26,921][744403] Decorrelating experience for 256 frames...
+[2023-03-09 14:30:26,977][744534] Decorrelating experience for 256 frames...
+[2023-03-09 14:30:26,997][744404] Decorrelating experience for 320 frames...
+[2023-03-09 14:30:27,015][744438] Decorrelating experience for 320 frames...
+[2023-03-09 14:30:27,019][744470] Decorrelating experience for 320 frames...
+[2023-03-09 14:30:27,027][744502] Decorrelating experience for 320 frames...
+[2023-03-09 14:30:27,028][744405] Decorrelating experience for 320 frames...
+[2023-03-09 14:30:27,035][744403] Decorrelating experience for 320 frames...
+[2023-03-09 14:30:27,091][744534] Decorrelating experience for 320 frames...
+[2023-03-09 14:30:27,135][744404] Decorrelating experience for 384 frames...
+[2023-03-09 14:30:27,157][744470] Decorrelating experience for 384 frames...
+[2023-03-09 14:30:27,158][744438] Decorrelating experience for 384 frames...
+[2023-03-09 14:30:27,171][744405] Decorrelating experience for 384 frames...
+[2023-03-09 14:30:27,174][744403] Decorrelating experience for 384 frames...
+[2023-03-09 14:30:27,194][744502] Decorrelating experience for 384 frames...
+[2023-03-09 14:30:27,230][744534] Decorrelating experience for 384 frames...
+[2023-03-09 14:30:27,299][744404] Decorrelating experience for 448 frames...
+[2023-03-09 14:30:27,325][744438] Decorrelating experience for 448 frames...
+[2023-03-09 14:30:27,337][744405] Decorrelating experience for 448 frames...
+[2023-03-09 14:30:27,338][744470] Decorrelating experience for 448 frames...
+[2023-03-09 14:30:27,359][744502] Decorrelating experience for 448 frames...
+[2023-03-09 14:30:27,363][744403] Decorrelating experience for 448 frames...
+[2023-03-09 14:30:27,414][744534] Decorrelating experience for 448 frames...
+[2023-03-09 14:30:28,995][744089] Fps is (10 sec: 0.0, 60 sec: 0.0, 300 sec: 0.0). Total num frames: 0. Throughput: 0: 13.2. Samples: 132. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
+[2023-03-09 14:30:28,995][744089] Avg episode reward: [(0, '0.775')]
+[2023-03-09 14:30:28,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000000_0.pth...
+[2023-03-09 14:30:29,208][744406] Decorrelating experience for 256 frames...
+[2023-03-09 14:30:29,321][744406] Decorrelating experience for 320 frames...
+[2023-03-09 14:30:29,460][744406] Decorrelating experience for 384 frames...
+[2023-03-09 14:30:29,624][744406] Decorrelating experience for 448 frames...
+[2023-03-09 14:30:33,995][744089] Fps is (10 sec: 3686.4, 60 sec: 2457.6, 300 sec: 2457.6). Total num frames: 36864. Throughput: 0: 2453.3. Samples: 36800. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:30:33,995][744089] Avg episode reward: [(0, '4.259')]
+[2023-03-09 14:30:34,353][744402] Updated weights for policy 0, policy_version 80 (0.0005)
+[2023-03-09 14:30:36,341][744089] Heartbeat connected on Batcher_0
+[2023-03-09 14:30:36,343][744089] Heartbeat connected on LearnerWorker_p0
+[2023-03-09 14:30:36,348][744089] Heartbeat connected on InferenceWorker_p0-w0
+[2023-03-09 14:30:36,352][744089] Heartbeat connected on RolloutWorker_w0
+[2023-03-09 14:30:36,357][744089] Heartbeat connected on RolloutWorker_w1
+[2023-03-09 14:30:36,358][744089] Heartbeat connected on RolloutWorker_w2
+[2023-03-09 14:30:36,362][744089] Heartbeat connected on RolloutWorker_w4
+[2023-03-09 14:30:36,362][744089] Heartbeat connected on RolloutWorker_w3
+[2023-03-09 14:30:36,363][744089] Heartbeat connected on RolloutWorker_w5
+[2023-03-09 14:30:36,366][744089] Heartbeat connected on RolloutWorker_w6
+[2023-03-09 14:30:36,369][744089] Heartbeat connected on RolloutWorker_w7
+[2023-03-09 14:30:38,995][744089] Fps is (10 sec: 7782.5, 60 sec: 3891.2, 300 sec: 3891.2). Total num frames: 77824. Throughput: 0: 3072.0. Samples: 61440. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:30:38,995][744089] Avg episode reward: [(0, '3.421')]
+[2023-03-09 14:30:39,129][744402] Updated weights for policy 0, policy_version 160 (0.0005)
+[2023-03-09 14:30:43,757][744402] Updated weights for policy 0, policy_version 240 (0.0005)
+[2023-03-09 14:30:43,995][744089] Fps is (10 sec: 8601.5, 60 sec: 4915.2, 300 sec: 4915.2). Total num frames: 122880. Throughput: 0: 4590.4. Samples: 114760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:30:43,996][744089] Avg episode reward: [(0, '4.776')]
+[2023-03-09 14:30:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000240_122880.pth...
+[2023-03-09 14:30:44,002][744358] Saving new best policy, reward=4.776!
+[2023-03-09 14:30:48,308][744402] Updated weights for policy 0, policy_version 320 (0.0005)
+[2023-03-09 14:30:48,995][744089] Fps is (10 sec: 9011.1, 60 sec: 5597.9, 300 sec: 5597.9). Total num frames: 167936. Throughput: 0: 5598.1. Samples: 167944. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:30:48,995][744089] Avg episode reward: [(0, '3.491')]
+[2023-03-09 14:30:53,076][744402] Updated weights for policy 0, policy_version 400 (0.0005)
+[2023-03-09 14:30:53,995][744089] Fps is (10 sec: 8601.8, 60 sec: 5968.5, 300 sec: 5968.5). Total num frames: 208896. Throughput: 0: 5534.8. Samples: 193716. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:30:53,995][744089] Avg episode reward: [(0, '10.663')]
+[2023-03-09 14:30:53,995][744358] Saving new best policy, reward=10.663!
+[2023-03-09 14:30:57,875][744402] Updated weights for policy 0, policy_version 480 (0.0005)
+[2023-03-09 14:30:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 6348.8, 300 sec: 6348.8). Total num frames: 253952. Throughput: 0: 6141.9. Samples: 245676. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:30:58,995][744089] Avg episode reward: [(0, '10.017')]
+[2023-03-09 14:30:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000496_253952.pth...
+[2023-03-09 14:30:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000000_0.pth
+[2023-03-09 14:31:02,815][744402] Updated weights for policy 0, policy_version 560 (0.0005)
+[2023-03-09 14:31:03,995][744089] Fps is (10 sec: 8601.5, 60 sec: 6553.6, 300 sec: 6553.6). Total num frames: 294912. Throughput: 0: 6566.4. Samples: 295488. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:31:03,996][744089] Avg episode reward: [(0, '13.679')]
+[2023-03-09 14:31:03,996][744358] Saving new best policy, reward=13.679!
+[2023-03-09 14:31:07,532][744402] Updated weights for policy 0, policy_version 640 (0.0006)
+[2023-03-09 14:31:08,995][744089] Fps is (10 sec: 8601.6, 60 sec: 6799.4, 300 sec: 6799.4). Total num frames: 339968. Throughput: 0: 7123.6. Samples: 320564. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:31:08,995][744089] Avg episode reward: [(0, '8.904')]
+[2023-03-09 14:31:12,326][744402] Updated weights for policy 0, policy_version 720 (0.0005)
+[2023-03-09 14:31:13,995][744089] Fps is (10 sec: 8601.5, 60 sec: 6926.0, 300 sec: 6926.0). Total num frames: 380928. Throughput: 0: 8280.1. Samples: 372736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:31:13,996][744089] Avg episode reward: [(0, '9.592')]
+[2023-03-09 14:31:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000744_380928.pth...
+[2023-03-09 14:31:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000240_122880.pth
+[2023-03-09 14:31:17,178][744402] Updated weights for policy 0, policy_version 800 (0.0005)
+[2023-03-09 14:31:18,995][744089] Fps is (10 sec: 8192.0, 60 sec: 7031.5, 300 sec: 7031.5). Total num frames: 421888. Throughput: 0: 8585.1. Samples: 423128. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:31:18,995][744089] Avg episode reward: [(0, '18.721')]
+[2023-03-09 14:31:18,996][744358] Saving new best policy, reward=18.721!
+[2023-03-09 14:31:22,238][744402] Updated weights for policy 0, policy_version 880 (0.0005)
+[2023-03-09 14:31:23,995][744089] Fps is (10 sec: 8192.2, 60 sec: 7714.1, 300 sec: 7120.8). Total num frames: 462848. Throughput: 0: 8567.8. Samples: 446992. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:31:23,995][744089] Avg episode reward: [(0, '36.797')]
+[2023-03-09 14:31:24,023][744358] Saving new best policy, reward=36.797!
+[2023-03-09 14:31:27,053][744402] Updated weights for policy 0, policy_version 960 (0.0005)
+[2023-03-09 14:31:28,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8396.8, 300 sec: 7197.3). Total num frames: 503808. Throughput: 0: 8521.4. Samples: 498224. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:31:28,995][744089] Avg episode reward: [(0, '37.532')]
+[2023-03-09 14:31:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000984_503808.pth...
+[2023-03-09 14:31:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000496_253952.pth
+[2023-03-09 14:31:29,001][744358] Saving new best policy, reward=37.532!
+[2023-03-09 14:31:31,894][744402] Updated weights for policy 0, policy_version 1040 (0.0005)
+[2023-03-09 14:31:33,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8465.1, 300 sec: 7263.6). Total num frames: 544768. Throughput: 0: 8437.7. Samples: 547640. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:31:33,995][744089] Avg episode reward: [(0, '40.477')]
+[2023-03-09 14:31:34,007][744358] Saving new best policy, reward=40.477!
+[2023-03-09 14:31:36,778][744402] Updated weights for policy 0, policy_version 1120 (0.0005)
+[2023-03-09 14:31:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8601.6, 300 sec: 7424.0). Total num frames: 593920. Throughput: 0: 8439.9. Samples: 573512. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:31:38,995][744089] Avg episode reward: [(0, '34.215')]
+[2023-03-09 14:31:41,245][744402] Updated weights for policy 0, policy_version 1200 (0.0005)
+[2023-03-09 14:31:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8533.3, 300 sec: 7469.2). Total num frames: 634880. Throughput: 0: 8481.4. Samples: 627340. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:31:43,995][744089] Avg episode reward: [(0, '44.582')]
+[2023-03-09 14:31:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000001240_634880.pth...
+[2023-03-09 14:31:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000744_380928.pth
+[2023-03-09 14:31:44,001][744358] Saving new best policy, reward=44.582!
+[2023-03-09 14:31:46,146][744402] Updated weights for policy 0, policy_version 1280 (0.0005)
+[2023-03-09 14:31:48,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8465.1, 300 sec: 7509.3). Total num frames: 675840. Throughput: 0: 8474.2. Samples: 676828. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:31:48,995][744089] Avg episode reward: [(0, '26.406')]
+[2023-03-09 14:31:50,966][744402] Updated weights for policy 0, policy_version 1360 (0.0005)
+[2023-03-09 14:31:53,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8533.3, 300 sec: 7588.4). Total num frames: 720896. Throughput: 0: 8532.2. Samples: 704512. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:31:53,996][744089] Avg episode reward: [(0, '14.066')]
+[2023-03-09 14:31:55,471][744402] Updated weights for policy 0, policy_version 1440 (0.0005)
+[2023-03-09 14:31:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8533.3, 300 sec: 7659.5). Total num frames: 765952. Throughput: 0: 8552.1. Samples: 757580. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:31:58,995][744089] Avg episode reward: [(0, '12.602')]
+[2023-03-09 14:31:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000001496_765952.pth...
+[2023-03-09 14:31:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000000984_503808.pth
+[2023-03-09 14:32:00,248][744402] Updated weights for policy 0, policy_version 1520 (0.0005)
+[2023-03-09 14:32:03,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8533.3, 300 sec: 7684.9). Total num frames: 806912. Throughput: 0: 8549.1. Samples: 807836. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:32:03,995][744089] Avg episode reward: [(0, '18.608')]
+[2023-03-09 14:32:05,107][744402] Updated weights for policy 0, policy_version 1600 (0.0005)
+[2023-03-09 14:32:08,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8533.3, 300 sec: 7745.2). Total num frames: 851968. Throughput: 0: 8614.7. Samples: 834652. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:32:08,995][744089] Avg episode reward: [(0, '19.238')]
+[2023-03-09 14:32:09,598][744402] Updated weights for policy 0, policy_version 1680 (0.0005)
+[2023-03-09 14:32:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8601.6, 300 sec: 7800.2). Total num frames: 897024. Throughput: 0: 8678.0. Samples: 888732. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:32:13,995][744089] Avg episode reward: [(0, '49.963')]
+[2023-03-09 14:32:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000001752_897024.pth...
+[2023-03-09 14:32:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000001240_634880.pth
+[2023-03-09 14:32:14,001][744358] Saving new best policy, reward=49.963!
+[2023-03-09 14:32:14,292][744402] Updated weights for policy 0, policy_version 1760 (0.0005)
+[2023-03-09 14:32:18,964][744402] Updated weights for policy 0, policy_version 1840 (0.0005)
+[2023-03-09 14:32:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8669.9, 300 sec: 7850.7). Total num frames: 942080. Throughput: 0: 8761.0. Samples: 941884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:32:18,995][744089] Avg episode reward: [(0, '69.766')]
+[2023-03-09 14:32:18,996][744358] Saving new best policy, reward=69.766!
+[2023-03-09 14:32:23,542][744402] Updated weights for policy 0, policy_version 1920 (0.0005)
+[2023-03-09 14:32:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8738.1, 300 sec: 7897.1). Total num frames: 987136. Throughput: 0: 8738.0. Samples: 966720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:32:23,995][744089] Avg episode reward: [(0, '73.539')]
+[2023-03-09 14:32:23,996][744358] Saving new best policy, reward=73.539!
+[2023-03-09 14:32:27,949][744402] Updated weights for policy 0, policy_version 2000 (0.0005)
+[2023-03-09 14:32:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8806.4, 300 sec: 7939.9). Total num frames: 1032192. Throughput: 0: 8790.8. Samples: 1022924. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:32:28,996][744089] Avg episode reward: [(0, '85.891')]
+[2023-03-09 14:32:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002016_1032192.pth...
+[2023-03-09 14:32:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000001496_765952.pth
+[2023-03-09 14:32:29,001][744358] Saving new best policy, reward=85.891!
+[2023-03-09 14:32:32,771][744402] Updated weights for policy 0, policy_version 2080 (0.0005)
+[2023-03-09 14:32:33,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8806.4, 300 sec: 7949.3). Total num frames: 1073152. Throughput: 0: 8821.7. Samples: 1073804. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:32:33,995][744089] Avg episode reward: [(0, '94.625')]
+[2023-03-09 14:32:33,996][744358] Saving new best policy, reward=94.625!
+[2023-03-09 14:32:37,630][744402] Updated weights for policy 0, policy_version 2160 (0.0005)
+[2023-03-09 14:32:38,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8669.9, 300 sec: 7957.9). Total num frames: 1114112. Throughput: 0: 8776.0. Samples: 1099432. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:32:38,995][744089] Avg episode reward: [(0, '49.093')]
+[2023-03-09 14:32:42,448][744402] Updated weights for policy 0, policy_version 2240 (0.0005)
+[2023-03-09 14:32:43,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8738.1, 300 sec: 7994.3). Total num frames: 1159168. Throughput: 0: 8740.2. Samples: 1150888. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:32:43,996][744089] Avg episode reward: [(0, '28.548')]
+[2023-03-09 14:32:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002264_1159168.pth...
+[2023-03-09 14:32:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000001752_897024.pth
+[2023-03-09 14:32:47,102][744402] Updated weights for policy 0, policy_version 2320 (0.0005)
+[2023-03-09 14:32:48,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8738.1, 300 sec: 8000.9). Total num frames: 1200128. Throughput: 0: 8769.5. Samples: 1202464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:32:48,996][744089] Avg episode reward: [(0, '27.272')]
+[2023-03-09 14:32:52,137][744402] Updated weights for policy 0, policy_version 2400 (0.0006)
+[2023-03-09 14:32:53,995][744089] Fps is (10 sec: 8192.1, 60 sec: 8669.9, 300 sec: 8007.0). Total num frames: 1241088. Throughput: 0: 8698.0. Samples: 1226064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:32:53,995][744089] Avg episode reward: [(0, '20.695')]
+[2023-03-09 14:32:57,027][744402] Updated weights for policy 0, policy_version 2480 (0.0005)
+[2023-03-09 14:32:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8669.9, 300 sec: 8038.4). Total num frames: 1286144. Throughput: 0: 8635.5. Samples: 1277328. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:32:58,996][744089] Avg episode reward: [(0, '19.513')]
+[2023-03-09 14:32:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002512_1286144.pth...
+[2023-03-09 14:32:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002016_1032192.pth
+[2023-03-09 14:33:01,892][744402] Updated weights for policy 0, policy_version 2560 (0.0005)
+[2023-03-09 14:33:03,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8669.9, 300 sec: 8043.1). Total num frames: 1327104. Throughput: 0: 8562.0. Samples: 1327176. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:33:03,995][744089] Avg episode reward: [(0, '23.950')]
+[2023-03-09 14:33:06,601][744402] Updated weights for policy 0, policy_version 2640 (0.0005)
+[2023-03-09 14:33:08,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8601.6, 300 sec: 8047.4). Total num frames: 1368064. Throughput: 0: 8598.2. Samples: 1353640. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:33:08,996][744089] Avg episode reward: [(0, '25.476')]
+[2023-03-09 14:33:11,699][744402] Updated weights for policy 0, policy_version 2720 (0.0005)
+[2023-03-09 14:33:13,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8533.3, 300 sec: 8051.6). Total num frames: 1409024. Throughput: 0: 8397.2. Samples: 1400800. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:33:13,996][744089] Avg episode reward: [(0, '40.355')]
+[2023-03-09 14:33:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002752_1409024.pth...
+[2023-03-09 14:33:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002264_1159168.pth
+[2023-03-09 14:33:16,861][744402] Updated weights for policy 0, policy_version 2800 (0.0004)
+[2023-03-09 14:33:18,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8465.1, 300 sec: 8055.5). Total num frames: 1449984. Throughput: 0: 8363.9. Samples: 1450180. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:33:18,995][744089] Avg episode reward: [(0, '48.506')]
+[2023-03-09 14:33:21,732][744402] Updated weights for policy 0, policy_version 2880 (0.0005)
+[2023-03-09 14:33:23,995][744089] Fps is (10 sec: 8192.1, 60 sec: 8396.8, 300 sec: 8059.2). Total num frames: 1490944. Throughput: 0: 8344.6. Samples: 1474940. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:33:23,995][744089] Avg episode reward: [(0, '72.443')]
+[2023-03-09 14:33:26,789][744402] Updated weights for policy 0, policy_version 2960 (0.0006)
+[2023-03-09 14:33:28,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8328.5, 300 sec: 8062.7). Total num frames: 1531904. Throughput: 0: 8285.0. Samples: 1523712. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:33:28,995][744089] Avg episode reward: [(0, '49.838')]
+[2023-03-09 14:33:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002992_1531904.pth...
+[2023-03-09 14:33:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002512_1286144.pth
+[2023-03-09 14:33:31,750][744402] Updated weights for policy 0, policy_version 3040 (0.0005)
+[2023-03-09 14:33:33,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8328.5, 300 sec: 8066.0). Total num frames: 1572864. Throughput: 0: 8232.7. Samples: 1572936. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:33:33,995][744089] Avg episode reward: [(0, '48.950')]
+[2023-03-09 14:33:36,501][744402] Updated weights for policy 0, policy_version 3120 (0.0005)
+[2023-03-09 14:33:38,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8396.8, 300 sec: 8089.6). Total num frames: 1617920. Throughput: 0: 8330.0. Samples: 1600916. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:33:38,995][744089] Avg episode reward: [(0, '57.467')]
+[2023-03-09 14:33:41,392][744402] Updated weights for policy 0, policy_version 3200 (0.0005)
+[2023-03-09 14:33:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8396.8, 300 sec: 8112.1). Total num frames: 1662976. Throughput: 0: 8328.0. Samples: 1652088. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:33:43,995][744089] Avg episode reward: [(0, '53.702')]
+[2023-03-09 14:33:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000003248_1662976.pth...
+[2023-03-09 14:33:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002752_1409024.pth
+[2023-03-09 14:33:46,016][744402] Updated weights for policy 0, policy_version 3280 (0.0006)
+[2023-03-09 14:33:48,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8328.5, 300 sec: 8094.5). Total num frames: 1699840. Throughput: 0: 8346.6. Samples: 1702772. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:33:48,995][744089] Avg episode reward: [(0, '78.036')]
+[2023-03-09 14:33:50,948][744402] Updated weights for policy 0, policy_version 3360 (0.0005)
+[2023-03-09 14:33:53,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8396.8, 300 sec: 8115.8). Total num frames: 1744896. Throughput: 0: 8331.9. Samples: 1728576. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:33:53,995][744089] Avg episode reward: [(0, '99.810')]
+[2023-03-09 14:33:54,020][744358] Saving new best policy, reward=99.810!
+[2023-03-09 14:33:55,350][744402] Updated weights for policy 0, policy_version 3440 (0.0005)
+[2023-03-09 14:33:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 8465.1, 300 sec: 8154.8). Total num frames: 1794048. Throughput: 0: 8492.6. Samples: 1782968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:33:58,996][744089] Avg episode reward: [(0, '87.351')]
+[2023-03-09 14:33:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000003504_1794048.pth...
+[2023-03-09 14:33:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000002992_1531904.pth
+[2023-03-09 14:34:00,017][744402] Updated weights for policy 0, policy_version 3520 (0.0005)
+[2023-03-09 14:34:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8465.1, 300 sec: 8155.6). Total num frames: 1835008. Throughput: 0: 8567.1. Samples: 1835700. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:03,995][744089] Avg episode reward: [(0, '103.110')]
+[2023-03-09 14:34:03,996][744358] Saving new best policy, reward=103.110!
+[2023-03-09 14:34:04,715][744402] Updated weights for policy 0, policy_version 3600 (0.0005)
+[2023-03-09 14:34:08,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8465.1, 300 sec: 8156.4). Total num frames: 1875968. Throughput: 0: 8549.2. Samples: 1859656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:08,995][744089] Avg episode reward: [(0, '80.465')]
+[2023-03-09 14:34:09,678][744402] Updated weights for policy 0, policy_version 3680 (0.0004)
+[2023-03-09 14:34:13,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8533.3, 300 sec: 8174.6). Total num frames: 1921024. Throughput: 0: 8646.8. Samples: 1912820. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:34:13,996][744089] Avg episode reward: [(0, '45.587')]
+[2023-03-09 14:34:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000003752_1921024.pth...
+[2023-03-09 14:34:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000003248_1662976.pth
+[2023-03-09 14:34:14,354][744402] Updated weights for policy 0, policy_version 3760 (0.0005)
+[2023-03-09 14:34:18,995][744089] Fps is (10 sec: 8192.1, 60 sec: 8465.1, 300 sec: 8157.9). Total num frames: 1957888. Throughput: 0: 8619.4. Samples: 1960808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:18,995][744089] Avg episode reward: [(0, '30.918')]
+[2023-03-09 14:34:19,536][744402] Updated weights for policy 0, policy_version 3840 (0.0005)
+[2023-03-09 14:34:23,995][744089] Fps is (10 sec: 7782.5, 60 sec: 8465.1, 300 sec: 8158.6). Total num frames: 1998848. Throughput: 0: 8537.2. Samples: 1985092. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:23,995][744089] Avg episode reward: [(0, '31.464')]
+[2023-03-09 14:34:24,666][744402] Updated weights for policy 0, policy_version 3920 (0.0005)
+[2023-03-09 14:34:28,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8533.3, 300 sec: 8175.6). Total num frames: 2043904. Throughput: 0: 8507.8. Samples: 2034940. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:28,996][744089] Avg episode reward: [(0, '32.073')]
+[2023-03-09 14:34:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000003992_2043904.pth...
+[2023-03-09 14:34:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000003504_1794048.pth
+[2023-03-09 14:34:29,380][744402] Updated weights for policy 0, policy_version 4000 (0.0005)
+[2023-03-09 14:34:33,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8533.3, 300 sec: 8175.9). Total num frames: 2084864. Throughput: 0: 8543.4. Samples: 2087224. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:33,995][744089] Avg episode reward: [(0, '31.052')]
+[2023-03-09 14:34:34,103][744402] Updated weights for policy 0, policy_version 4080 (0.0005)
+[2023-03-09 14:34:38,995][744089] Fps is (10 sec: 8192.1, 60 sec: 8465.1, 300 sec: 8176.2). Total num frames: 2125824. Throughput: 0: 8554.7. Samples: 2113536. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:38,995][744089] Avg episode reward: [(0, '34.796')]
+[2023-03-09 14:34:39,022][744402] Updated weights for policy 0, policy_version 4160 (0.0005)
+[2023-03-09 14:34:43,919][744402] Updated weights for policy 0, policy_version 4240 (0.0005)
+[2023-03-09 14:34:43,995][744089] Fps is (10 sec: 8601.4, 60 sec: 8465.1, 300 sec: 8192.0). Total num frames: 2170880. Throughput: 0: 8414.7. Samples: 2161632. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:43,996][744089] Avg episode reward: [(0, '39.287')]
+[2023-03-09 14:34:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000004240_2170880.pth...
+[2023-03-09 14:34:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000003752_1921024.pth
+[2023-03-09 14:34:48,839][744402] Updated weights for policy 0, policy_version 4320 (0.0005)
+[2023-03-09 14:34:48,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8533.3, 300 sec: 8192.0). Total num frames: 2211840. Throughput: 0: 8358.1. Samples: 2211816. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:34:48,995][744089] Avg episode reward: [(0, '41.316')]
+[2023-03-09 14:34:53,692][744402] Updated weights for policy 0, policy_version 4400 (0.0005)
+[2023-03-09 14:34:53,995][744089] Fps is (10 sec: 8192.1, 60 sec: 8465.1, 300 sec: 8192.0). Total num frames: 2252800. Throughput: 0: 8371.5. Samples: 2236372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:53,995][744089] Avg episode reward: [(0, '20.777')]
+[2023-03-09 14:34:58,090][744402] Updated weights for policy 0, policy_version 4480 (0.0005)
+[2023-03-09 14:34:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8396.8, 300 sec: 8206.6). Total num frames: 2297856. Throughput: 0: 8409.8. Samples: 2291260. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:34:58,995][744089] Avg episode reward: [(0, '10.617')]
+[2023-03-09 14:34:59,029][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000004496_2301952.pth...
+[2023-03-09 14:34:59,030][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000003992_2043904.pth
+[2023-03-09 14:35:02,830][744402] Updated weights for policy 0, policy_version 4560 (0.0005)
+[2023-03-09 14:35:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8465.1, 300 sec: 8220.7). Total num frames: 2342912. Throughput: 0: 8494.6. Samples: 2343064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:03,996][744089] Avg episode reward: [(0, '13.236')]
+[2023-03-09 14:35:07,924][744402] Updated weights for policy 0, policy_version 4640 (0.0005)
+[2023-03-09 14:35:08,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8465.1, 300 sec: 8220.2). Total num frames: 2383872. Throughput: 0: 8495.5. Samples: 2367388. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:08,996][744089] Avg episode reward: [(0, '14.843')]
+[2023-03-09 14:35:12,855][744402] Updated weights for policy 0, policy_version 4720 (0.0005)
+[2023-03-09 14:35:13,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8396.8, 300 sec: 8219.8). Total num frames: 2424832. Throughput: 0: 8482.2. Samples: 2416640. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:13,996][744089] Avg episode reward: [(0, '16.682')]
+[2023-03-09 14:35:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000004736_2424832.pth...
+[2023-03-09 14:35:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000004240_2170880.pth
+[2023-03-09 14:35:17,674][744402] Updated weights for policy 0, policy_version 4800 (0.0005)
+[2023-03-09 14:35:18,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8533.3, 300 sec: 8372.5). Total num frames: 2469888. Throughput: 0: 8463.5. Samples: 2468084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:18,996][744089] Avg episode reward: [(0, '22.878')]
+[2023-03-09 14:35:22,185][744402] Updated weights for policy 0, policy_version 4880 (0.0005)
+[2023-03-09 14:35:23,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8533.3, 300 sec: 8511.4). Total num frames: 2510848. Throughput: 0: 8471.6. Samples: 2494756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:23,995][744089] Avg episode reward: [(0, '28.301')]
+[2023-03-09 14:35:26,864][744402] Updated weights for policy 0, policy_version 4960 (0.0005)
+[2023-03-09 14:35:28,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8533.3, 300 sec: 8539.1). Total num frames: 2555904. Throughput: 0: 8581.0. Samples: 2547776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:28,996][744089] Avg episode reward: [(0, '30.848')]
+[2023-03-09 14:35:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000004992_2555904.pth...
+[2023-03-09 14:35:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000004496_2301952.pth
+[2023-03-09 14:35:29,625][744358] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000007
+[2023-03-09 14:35:31,384][744402] Updated weights for policy 0, policy_version 5040 (0.0004)
+[2023-03-09 14:35:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8601.6, 300 sec: 8553.0). Total num frames: 2600960. Throughput: 0: 8682.1. Samples: 2602508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:33,995][744089] Avg episode reward: [(0, '45.490')]
+[2023-03-09 14:35:35,803][744402] Updated weights for policy 0, policy_version 5120 (0.0005)
+[2023-03-09 14:35:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 8738.1, 300 sec: 8566.9). Total num frames: 2650112. Throughput: 0: 8748.3. Samples: 2630044. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:35:38,995][744089] Avg episode reward: [(0, '45.578')]
+[2023-03-09 14:35:40,177][744402] Updated weights for policy 0, policy_version 5200 (0.0005)
+[2023-03-09 14:35:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8669.9, 300 sec: 8553.0). Total num frames: 2691072. Throughput: 0: 8709.1. Samples: 2683168. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:43,996][744089] Avg episode reward: [(0, '39.201')]
+[2023-03-09 14:35:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000005256_2691072.pth...
+[2023-03-09 14:35:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000004736_2424832.pth
+[2023-03-09 14:35:45,011][744402] Updated weights for policy 0, policy_version 5280 (0.0005)
+[2023-03-09 14:35:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8806.4, 300 sec: 8580.8). Total num frames: 2740224. Throughput: 0: 8794.9. Samples: 2738832. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:35:48,995][744089] Avg episode reward: [(0, '52.443')]
+[2023-03-09 14:35:49,438][744402] Updated weights for policy 0, policy_version 5360 (0.0005)
+[2023-03-09 14:35:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8806.4, 300 sec: 8566.9). Total num frames: 2781184. Throughput: 0: 8831.6. Samples: 2764808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:35:53,995][744089] Avg episode reward: [(0, '41.378')]
+[2023-03-09 14:35:54,036][744402] Updated weights for policy 0, policy_version 5440 (0.0005)
+[2023-03-09 14:35:58,645][744402] Updated weights for policy 0, policy_version 5520 (0.0005)
+[2023-03-09 14:35:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8806.4, 300 sec: 8580.8). Total num frames: 2826240. Throughput: 0: 8929.0. Samples: 2818444. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:35:58,995][744089] Avg episode reward: [(0, '39.396')]
+[2023-03-09 14:35:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000005520_2826240.pth...
+[2023-03-09 14:35:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000004992_2555904.pth
+[2023-03-09 14:36:03,448][744402] Updated weights for policy 0, policy_version 5600 (0.0006)
+[2023-03-09 14:36:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8806.4, 300 sec: 8580.8). Total num frames: 2871296. Throughput: 0: 8954.9. Samples: 2871052. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:36:03,995][744089] Avg episode reward: [(0, '33.649')]
+[2023-03-09 14:36:08,075][744402] Updated weights for policy 0, policy_version 5680 (0.0004)
+[2023-03-09 14:36:08,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8806.4, 300 sec: 8580.8). Total num frames: 2912256. Throughput: 0: 8915.1. Samples: 2895936. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:36:08,995][744089] Avg episode reward: [(0, '37.666')]
+[2023-03-09 14:36:12,782][744402] Updated weights for policy 0, policy_version 5760 (0.0004)
+[2023-03-09 14:36:13,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8874.7, 300 sec: 8594.7). Total num frames: 2957312. Throughput: 0: 8920.2. Samples: 2949184. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:36:13,996][744089] Avg episode reward: [(0, '43.711')]
+[2023-03-09 14:36:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000005776_2957312.pth...
+[2023-03-09 14:36:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000005256_2691072.pth
+[2023-03-09 14:36:17,808][744402] Updated weights for policy 0, policy_version 5840 (0.0005)
+[2023-03-09 14:36:18,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8806.4, 300 sec: 8594.7). Total num frames: 2998272. Throughput: 0: 8824.3. Samples: 2999600. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:36:18,995][744089] Avg episode reward: [(0, '50.171')]
+[2023-03-09 14:36:22,557][744402] Updated weights for policy 0, policy_version 5920 (0.0006)
+[2023-03-09 14:36:23,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8874.7, 300 sec: 8608.5). Total num frames: 3043328. Throughput: 0: 8780.9. Samples: 3025184. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:36:23,995][744089] Avg episode reward: [(0, '54.072')]
+[2023-03-09 14:36:27,110][744402] Updated weights for policy 0, policy_version 6000 (0.0005)
+[2023-03-09 14:36:28,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8806.4, 300 sec: 8608.5). Total num frames: 3084288. Throughput: 0: 8787.1. Samples: 3078588. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:36:28,995][744089] Avg episode reward: [(0, '39.645')]
+[2023-03-09 14:36:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000006024_3084288.pth...
+[2023-03-09 14:36:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000005520_2826240.pth
+[2023-03-09 14:36:31,977][744402] Updated weights for policy 0, policy_version 6080 (0.0005)
+[2023-03-09 14:36:33,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8806.4, 300 sec: 8594.7). Total num frames: 3129344. Throughput: 0: 8724.3. Samples: 3131424. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:36:33,996][744089] Avg episode reward: [(0, '65.430')]
+[2023-03-09 14:36:36,146][744402] Updated weights for policy 0, policy_version 6160 (0.0005)
+[2023-03-09 14:36:38,995][744089] Fps is (10 sec: 9420.7, 60 sec: 8806.4, 300 sec: 8622.4). Total num frames: 3178496. Throughput: 0: 8788.5. Samples: 3160292. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:36:38,995][744089] Avg episode reward: [(0, '47.708')]
+[2023-03-09 14:36:40,629][744402] Updated weights for policy 0, policy_version 6240 (0.0005)
+[2023-03-09 14:36:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 8874.7, 300 sec: 8636.3). Total num frames: 3223552. Throughput: 0: 8817.5. Samples: 3215232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:36:43,996][744089] Avg episode reward: [(0, '34.338')]
+[2023-03-09 14:36:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000006296_3223552.pth...
+[2023-03-09 14:36:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000005776_2957312.pth
+[2023-03-09 14:36:45,212][744402] Updated weights for policy 0, policy_version 6320 (0.0005)
+[2023-03-09 14:36:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8806.4, 300 sec: 8636.3). Total num frames: 3268608. Throughput: 0: 8836.0. Samples: 3268672. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:36:48,995][744089] Avg episode reward: [(0, '36.168')]
+[2023-03-09 14:36:49,644][744402] Updated weights for policy 0, policy_version 6400 (0.0005)
+[2023-03-09 14:36:53,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8806.4, 300 sec: 8622.4). Total num frames: 3309568. Throughput: 0: 8863.9. Samples: 3294812. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:36:53,995][744089] Avg episode reward: [(0, '47.449')]
+[2023-03-09 14:36:54,654][744402] Updated weights for policy 0, policy_version 6480 (0.0005)
+[2023-03-09 14:36:58,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8806.4, 300 sec: 8636.3). Total num frames: 3354624. Throughput: 0: 8815.3. Samples: 3345872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:36:58,995][744089] Avg episode reward: [(0, '44.047')]
+[2023-03-09 14:36:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000006552_3354624.pth...
+[2023-03-09 14:36:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000006024_3084288.pth
+[2023-03-09 14:36:59,208][744402] Updated weights for policy 0, policy_version 6560 (0.0005)
+[2023-03-09 14:37:03,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8738.1, 300 sec: 8622.4). Total num frames: 3395584. Throughput: 0: 8832.0. Samples: 3397040. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:37:03,995][744089] Avg episode reward: [(0, '42.238')]
+[2023-03-09 14:37:04,183][744402] Updated weights for policy 0, policy_version 6640 (0.0005)
+[2023-03-09 14:37:08,995][744089] Fps is (10 sec: 8192.1, 60 sec: 8738.1, 300 sec: 8608.5). Total num frames: 3436544. Throughput: 0: 8789.4. Samples: 3420708. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:37:08,995][744089] Avg episode reward: [(0, '57.700')]
+[2023-03-09 14:37:09,093][744402] Updated weights for policy 0, policy_version 6720 (0.0006)
+[2023-03-09 14:37:13,894][744402] Updated weights for policy 0, policy_version 6800 (0.0005)
+[2023-03-09 14:37:13,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8738.1, 300 sec: 8608.5). Total num frames: 3481600. Throughput: 0: 8772.6. Samples: 3473356. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:37:13,996][744089] Avg episode reward: [(0, '91.919')]
+[2023-03-09 14:37:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000006800_3481600.pth...
+[2023-03-09 14:37:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000006296_3223552.pth
+[2023-03-09 14:37:18,744][744402] Updated weights for policy 0, policy_version 6880 (0.0005)
+[2023-03-09 14:37:18,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8738.1, 300 sec: 8594.7). Total num frames: 3522560. Throughput: 0: 8697.7. Samples: 3522820. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:37:18,995][744089] Avg episode reward: [(0, '84.605')]
+[2023-03-09 14:37:23,722][744402] Updated weights for policy 0, policy_version 6960 (0.0006)
+[2023-03-09 14:37:23,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8669.9, 300 sec: 8580.8). Total num frames: 3563520. Throughput: 0: 8603.7. Samples: 3547460. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:37:23,995][744089] Avg episode reward: [(0, '99.225')]
+[2023-03-09 14:37:28,064][744402] Updated weights for policy 0, policy_version 7040 (0.0005)
+[2023-03-09 14:37:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8806.4, 300 sec: 8608.5). Total num frames: 3612672. Throughput: 0: 8589.8. Samples: 3601772. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:37:28,995][744089] Avg episode reward: [(0, '147.436')]
+[2023-03-09 14:37:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000007056_3612672.pth...
+[2023-03-09 14:37:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000006552_3354624.pth
+[2023-03-09 14:37:29,002][744358] Saving new best policy, reward=147.436!
+[2023-03-09 14:37:32,488][744402] Updated weights for policy 0, policy_version 7120 (0.0005)
+[2023-03-09 14:37:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 8806.4, 300 sec: 8622.4). Total num frames: 3657728. Throughput: 0: 8634.8. Samples: 3657236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:37:33,995][744089] Avg episode reward: [(0, '140.026')]
+[2023-03-09 14:37:37,284][744402] Updated weights for policy 0, policy_version 7200 (0.0005)
+[2023-03-09 14:37:38,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8669.9, 300 sec: 8608.5). Total num frames: 3698688. Throughput: 0: 8612.4. Samples: 3682368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:37:38,995][744089] Avg episode reward: [(0, '122.176')]
+[2023-03-09 14:37:41,869][744402] Updated weights for policy 0, policy_version 7280 (0.0005)
+[2023-03-09 14:37:43,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8669.9, 300 sec: 8622.4). Total num frames: 3743744. Throughput: 0: 8661.2. Samples: 3735624. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:37:43,995][744089] Avg episode reward: [(0, '58.282')]
+[2023-03-09 14:37:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000007312_3743744.pth...
+[2023-03-09 14:37:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000006800_3481600.pth
+[2023-03-09 14:37:46,619][744402] Updated weights for policy 0, policy_version 7360 (0.0005)
+[2023-03-09 14:37:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8669.9, 300 sec: 8636.3). Total num frames: 3788800. Throughput: 0: 8681.2. Samples: 3787696. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:37:48,995][744089] Avg episode reward: [(0, '115.667')]
+[2023-03-09 14:37:51,080][744402] Updated weights for policy 0, policy_version 7440 (0.0006)
+[2023-03-09 14:37:53,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8738.1, 300 sec: 8636.3). Total num frames: 3833856. Throughput: 0: 8782.1. Samples: 3815904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:37:53,996][744089] Avg episode reward: [(0, '132.317')]
+[2023-03-09 14:37:55,574][744402] Updated weights for policy 0, policy_version 7520 (0.0005)
+[2023-03-09 14:37:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8738.1, 300 sec: 8650.2). Total num frames: 3878912. Throughput: 0: 8830.3. Samples: 3870720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:37:58,995][744089] Avg episode reward: [(0, '148.138')]
+[2023-03-09 14:37:58,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000007576_3878912.pth...
+[2023-03-09 14:37:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000007056_3612672.pth
+[2023-03-09 14:37:58,999][744358] Saving new best policy, reward=148.138!
+[2023-03-09 14:37:59,796][744402] Updated weights for policy 0, policy_version 7600 (0.0004)
+[2023-03-09 14:38:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 8874.7, 300 sec: 8678.0). Total num frames: 3928064. Throughput: 0: 9007.0. Samples: 3928136. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:03,995][744089] Avg episode reward: [(0, '130.019')]
+[2023-03-09 14:38:04,238][744402] Updated weights for policy 0, policy_version 7680 (0.0005)
+[2023-03-09 14:38:08,617][744402] Updated weights for policy 0, policy_version 7760 (0.0005)
+[2023-03-09 14:38:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 8942.9, 300 sec: 8691.9). Total num frames: 3973120. Throughput: 0: 9095.2. Samples: 3956744. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:38:08,995][744089] Avg episode reward: [(0, '90.364')]
+[2023-03-09 14:38:12,898][744402] Updated weights for policy 0, policy_version 7840 (0.0005)
+[2023-03-09 14:38:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 8719.6). Total num frames: 4022272. Throughput: 0: 9159.6. Samples: 4013952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:13,996][744089] Avg episode reward: [(0, '135.009')]
+[2023-03-09 14:38:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000007856_4022272.pth...
+[2023-03-09 14:38:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000007312_3743744.pth
+[2023-03-09 14:38:17,498][744402] Updated weights for policy 0, policy_version 7920 (0.0005)
+[2023-03-09 14:38:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 8733.5). Total num frames: 4067328. Throughput: 0: 9114.7. Samples: 4067400. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:18,995][744089] Avg episode reward: [(0, '129.630')]
+[2023-03-09 14:38:21,758][744402] Updated weights for policy 0, policy_version 8000 (0.0005)
+[2023-03-09 14:38:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 8747.4). Total num frames: 4112384. Throughput: 0: 9195.1. Samples: 4096148. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:23,995][744089] Avg episode reward: [(0, '169.038')]
+[2023-03-09 14:38:24,034][744358] Saving new best policy, reward=169.038!
+[2023-03-09 14:38:26,480][744402] Updated weights for policy 0, policy_version 8080 (0.0006)
+[2023-03-09 14:38:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 8761.3). Total num frames: 4157440. Throughput: 0: 9191.8. Samples: 4149256. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:38:28,995][744089] Avg episode reward: [(0, '241.948')]
+[2023-03-09 14:38:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000008120_4157440.pth...
+[2023-03-09 14:38:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000007576_3878912.pth
+[2023-03-09 14:38:29,002][744358] Saving new best policy, reward=241.948!
+[2023-03-09 14:38:31,100][744402] Updated weights for policy 0, policy_version 8160 (0.0006)
+[2023-03-09 14:38:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 8761.3). Total num frames: 4202496. Throughput: 0: 9216.9. Samples: 4202456. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:33,996][744089] Avg episode reward: [(0, '243.569')]
+[2023-03-09 14:38:33,996][744358] Saving new best policy, reward=243.569!
+[2023-03-09 14:38:35,521][744402] Updated weights for policy 0, policy_version 8240 (0.0005)
+[2023-03-09 14:38:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 8761.3). Total num frames: 4247552. Throughput: 0: 9205.8. Samples: 4230164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:38,995][744089] Avg episode reward: [(0, '146.114')]
+[2023-03-09 14:38:40,207][744402] Updated weights for policy 0, policy_version 8320 (0.0006)
+[2023-03-09 14:38:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 8789.0). Total num frames: 4292608. Throughput: 0: 9189.0. Samples: 4284224. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:43,995][744089] Avg episode reward: [(0, '60.227')]
+[2023-03-09 14:38:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000008384_4292608.pth...
+[2023-03-09 14:38:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000007856_4022272.pth
+[2023-03-09 14:38:44,727][744402] Updated weights for policy 0, policy_version 8400 (0.0005)
+[2023-03-09 14:38:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 8789.0). Total num frames: 4337664. Throughput: 0: 9100.6. Samples: 4337664. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:48,995][744089] Avg episode reward: [(0, '65.766')]
+[2023-03-09 14:38:49,286][744402] Updated weights for policy 0, policy_version 8480 (0.0005)
+[2023-03-09 14:38:53,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 8761.3). Total num frames: 4378624. Throughput: 0: 9025.4. Samples: 4362884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:38:53,995][744089] Avg episode reward: [(0, '59.066')]
+[2023-03-09 14:38:54,070][744402] Updated weights for policy 0, policy_version 8560 (0.0006)
+[2023-03-09 14:38:58,952][744402] Updated weights for policy 0, policy_version 8640 (0.0004)
+[2023-03-09 14:38:58,995][744089] Fps is (10 sec: 8601.5, 60 sec: 9079.5, 300 sec: 8775.2). Total num frames: 4423680. Throughput: 0: 8889.9. Samples: 4413996. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:38:58,995][744089] Avg episode reward: [(0, '64.141')]
+[2023-03-09 14:38:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000008640_4423680.pth...
+[2023-03-09 14:38:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000008120_4157440.pth
+[2023-03-09 14:39:03,550][744402] Updated weights for policy 0, policy_version 8720 (0.0005)
+[2023-03-09 14:39:03,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8942.9, 300 sec: 8775.2). Total num frames: 4464640. Throughput: 0: 8890.3. Samples: 4467464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:03,995][744089] Avg episode reward: [(0, '77.611')]
+[2023-03-09 14:39:08,155][744402] Updated weights for policy 0, policy_version 8800 (0.0005)
+[2023-03-09 14:39:08,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 8775.2). Total num frames: 4509696. Throughput: 0: 8835.6. Samples: 4493748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:08,995][744089] Avg episode reward: [(0, '117.353')]
+[2023-03-09 14:39:12,603][744402] Updated weights for policy 0, policy_version 8880 (0.0005)
+[2023-03-09 14:39:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 8802.9). Total num frames: 4554752. Throughput: 0: 8872.3. Samples: 4548508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:13,995][744089] Avg episode reward: [(0, '57.120')]
+[2023-03-09 14:39:14,040][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000008904_4558848.pth...
+[2023-03-09 14:39:14,042][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000008384_4292608.pth
+[2023-03-09 14:39:17,571][744402] Updated weights for policy 0, policy_version 8960 (0.0005)
+[2023-03-09 14:39:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 8816.8). Total num frames: 4599808. Throughput: 0: 8828.4. Samples: 4599732. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:18,995][744089] Avg episode reward: [(0, '62.114')]
+[2023-03-09 14:39:22,311][744402] Updated weights for policy 0, policy_version 9040 (0.0005)
+[2023-03-09 14:39:23,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8806.4, 300 sec: 8802.9). Total num frames: 4640768. Throughput: 0: 8760.4. Samples: 4624384. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:23,996][744089] Avg episode reward: [(0, '115.404')]
+[2023-03-09 14:39:26,986][744402] Updated weights for policy 0, policy_version 9120 (0.0005)
+[2023-03-09 14:39:28,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8806.4, 300 sec: 8816.8). Total num frames: 4685824. Throughput: 0: 8731.8. Samples: 4677156. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:39:28,996][744089] Avg episode reward: [(0, '132.442')]
+[2023-03-09 14:39:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000009152_4685824.pth...
+[2023-03-09 14:39:29,005][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000008640_4423680.pth
+[2023-03-09 14:39:31,844][744402] Updated weights for policy 0, policy_version 9200 (0.0005)
+[2023-03-09 14:39:33,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8738.1, 300 sec: 8816.8). Total num frames: 4726784. Throughput: 0: 8649.2. Samples: 4726880. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:33,995][744089] Avg episode reward: [(0, '144.216')]
+[2023-03-09 14:39:36,650][744402] Updated weights for policy 0, policy_version 9280 (0.0005)
+[2023-03-09 14:39:38,995][744089] Fps is (10 sec: 8192.2, 60 sec: 8669.9, 300 sec: 8802.9). Total num frames: 4767744. Throughput: 0: 8662.0. Samples: 4752676. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:38,995][744089] Avg episode reward: [(0, '177.052')]
+[2023-03-09 14:39:41,335][744402] Updated weights for policy 0, policy_version 9360 (0.0005)
+[2023-03-09 14:39:43,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8669.9, 300 sec: 8816.8). Total num frames: 4812800. Throughput: 0: 8683.4. Samples: 4804748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:43,995][744089] Avg episode reward: [(0, '177.758')]
+[2023-03-09 14:39:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000009400_4812800.pth...
+[2023-03-09 14:39:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000008904_4558848.pth
+[2023-03-09 14:39:45,922][744402] Updated weights for policy 0, policy_version 9440 (0.0005)
+[2023-03-09 14:39:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8669.9, 300 sec: 8830.7). Total num frames: 4857856. Throughput: 0: 8678.8. Samples: 4858012. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:39:48,996][744089] Avg episode reward: [(0, '161.667')]
+[2023-03-09 14:39:50,419][744402] Updated weights for policy 0, policy_version 9520 (0.0005)
+[2023-03-09 14:39:53,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8738.1, 300 sec: 8830.7). Total num frames: 4902912. Throughput: 0: 8726.8. Samples: 4886456. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:39:53,996][744089] Avg episode reward: [(0, '129.065')]
+[2023-03-09 14:39:55,392][744402] Updated weights for policy 0, policy_version 9600 (0.0004)
+[2023-03-09 14:39:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8669.9, 300 sec: 8816.8). Total num frames: 4943872. Throughput: 0: 8632.8. Samples: 4936984. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:39:58,995][744089] Avg episode reward: [(0, '129.031')]
+[2023-03-09 14:39:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000009656_4943872.pth...
+[2023-03-09 14:39:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000009152_4685824.pth
+[2023-03-09 14:40:00,056][744402] Updated weights for policy 0, policy_version 9680 (0.0006)
+[2023-03-09 14:40:03,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8738.1, 300 sec: 8830.7). Total num frames: 4988928. Throughput: 0: 8669.2. Samples: 4989848. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:40:03,996][744089] Avg episode reward: [(0, '161.457')]
+[2023-03-09 14:40:04,585][744402] Updated weights for policy 0, policy_version 9760 (0.0005)
+[2023-03-09 14:40:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8738.1, 300 sec: 8844.6). Total num frames: 5033984. Throughput: 0: 8699.4. Samples: 5015856. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:40:08,996][744089] Avg episode reward: [(0, '196.333')]
+[2023-03-09 14:40:09,320][744402] Updated weights for policy 0, policy_version 9840 (0.0005)
+[2023-03-09 14:40:13,922][744402] Updated weights for policy 0, policy_version 9920 (0.0005)
+[2023-03-09 14:40:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8738.1, 300 sec: 8844.6). Total num frames: 5079040. Throughput: 0: 8717.5. Samples: 5069444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:40:13,996][744089] Avg episode reward: [(0, '158.970')]
+[2023-03-09 14:40:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000009920_5079040.pth...
+[2023-03-09 14:40:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000009400_4812800.pth
+[2023-03-09 14:40:18,261][744402] Updated weights for policy 0, policy_version 10000 (0.0005)
+[2023-03-09 14:40:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8738.1, 300 sec: 8858.5). Total num frames: 5124096. Throughput: 0: 8843.6. Samples: 5124844. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:40:18,995][744089] Avg episode reward: [(0, '214.263')]
+[2023-03-09 14:40:22,930][744402] Updated weights for policy 0, policy_version 10080 (0.0005)
+[2023-03-09 14:40:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8806.4, 300 sec: 8858.5). Total num frames: 5169152. Throughput: 0: 8841.1. Samples: 5150524. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:40:23,995][744089] Avg episode reward: [(0, '240.610')]
+[2023-03-09 14:40:27,913][744402] Updated weights for policy 0, policy_version 10160 (0.0005)
+[2023-03-09 14:40:28,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8738.2, 300 sec: 8844.6). Total num frames: 5210112. Throughput: 0: 8824.2. Samples: 5201836. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:40:28,995][744089] Avg episode reward: [(0, '206.917')]
+[2023-03-09 14:40:29,004][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000010176_5210112.pth...
+[2023-03-09 14:40:29,007][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000009656_4943872.pth
+[2023-03-09 14:40:32,653][744402] Updated weights for policy 0, policy_version 10240 (0.0005)
+[2023-03-09 14:40:33,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8738.1, 300 sec: 8816.8). Total num frames: 5251072. Throughput: 0: 8757.3. Samples: 5252088. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:40:33,995][744089] Avg episode reward: [(0, '185.863')]
+[2023-03-09 14:40:37,150][744402] Updated weights for policy 0, policy_version 10320 (0.0005)
+[2023-03-09 14:40:38,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8874.7, 300 sec: 8844.6). Total num frames: 5300224. Throughput: 0: 8751.8. Samples: 5280288. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:40:38,995][744089] Avg episode reward: [(0, '141.307')]
+[2023-03-09 14:40:41,846][744402] Updated weights for policy 0, policy_version 10400 (0.0005)
+[2023-03-09 14:40:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8806.4, 300 sec: 8816.8). Total num frames: 5341184. Throughput: 0: 8800.2. Samples: 5332992. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:40:43,995][744089] Avg episode reward: [(0, '182.498')]
+[2023-03-09 14:40:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000010432_5341184.pth...
+[2023-03-09 14:40:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000009920_5079040.pth
+[2023-03-09 14:40:46,614][744402] Updated weights for policy 0, policy_version 10480 (0.0005)
+[2023-03-09 14:40:48,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8806.4, 300 sec: 8830.7). Total num frames: 5386240. Throughput: 0: 8812.4. Samples: 5386408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:40:48,995][744089] Avg episode reward: [(0, '156.971')]
+[2023-03-09 14:40:50,949][744402] Updated weights for policy 0, policy_version 10560 (0.0005)
+[2023-03-09 14:40:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8806.4, 300 sec: 8830.7). Total num frames: 5431296. Throughput: 0: 8869.4. Samples: 5414976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:40:53,995][744089] Avg episode reward: [(0, '160.141')]
+[2023-03-09 14:40:55,726][744402] Updated weights for policy 0, policy_version 10640 (0.0005)
+[2023-03-09 14:40:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8874.7, 300 sec: 8830.7). Total num frames: 5476352. Throughput: 0: 8826.1. Samples: 5466620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:40:58,996][744089] Avg episode reward: [(0, '197.942')]
+[2023-03-09 14:40:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000010696_5476352.pth...
+[2023-03-09 14:40:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000010176_5210112.pth
+[2023-03-09 14:41:00,089][744402] Updated weights for policy 0, policy_version 10720 (0.0005)
+[2023-03-09 14:41:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 8844.6). Total num frames: 5521408. Throughput: 0: 8818.9. Samples: 5521696. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:41:03,995][744089] Avg episode reward: [(0, '204.408')]
+[2023-03-09 14:41:04,728][744402] Updated weights for policy 0, policy_version 10800 (0.0005)
+[2023-03-09 14:41:08,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8806.4, 300 sec: 8830.7). Total num frames: 5562368. Throughput: 0: 8798.4. Samples: 5546452. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:41:08,996][744089] Avg episode reward: [(0, '166.015')]
+[2023-03-09 14:41:09,609][744402] Updated weights for policy 0, policy_version 10880 (0.0005)
+[2023-03-09 14:41:13,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8806.4, 300 sec: 8844.6). Total num frames: 5607424. Throughput: 0: 8832.4. Samples: 5599296. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:41:13,995][744089] Avg episode reward: [(0, '201.442')]
+[2023-03-09 14:41:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000010952_5607424.pth...
+[2023-03-09 14:41:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000010432_5341184.pth
+[2023-03-09 14:41:14,380][744402] Updated weights for policy 0, policy_version 10960 (0.0005)
+[2023-03-09 14:41:18,957][744402] Updated weights for policy 0, policy_version 11040 (0.0005)
+[2023-03-09 14:41:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8806.4, 300 sec: 8844.6). Total num frames: 5652480. Throughput: 0: 8883.7. Samples: 5651856. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:41:18,995][744089] Avg episode reward: [(0, '149.381')]
+[2023-03-09 14:41:23,357][744402] Updated weights for policy 0, policy_version 11120 (0.0005)
+[2023-03-09 14:41:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8806.4, 300 sec: 8858.5). Total num frames: 5697536. Throughput: 0: 8863.8. Samples: 5679160. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:41:23,996][744089] Avg episode reward: [(0, '155.310')]
+[2023-03-09 14:41:27,767][744402] Updated weights for policy 0, policy_version 11200 (0.0005)
+[2023-03-09 14:41:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 8858.5). Total num frames: 5742592. Throughput: 0: 8921.8. Samples: 5734472. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:41:28,995][744089] Avg episode reward: [(0, '211.194')]
+[2023-03-09 14:41:28,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000011216_5742592.pth...
+[2023-03-09 14:41:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000010696_5476352.pth
+[2023-03-09 14:41:32,209][744402] Updated weights for policy 0, policy_version 11280 (0.0005)
+[2023-03-09 14:41:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8942.9, 300 sec: 8844.6). Total num frames: 5787648. Throughput: 0: 8974.0. Samples: 5790236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:41:33,995][744089] Avg episode reward: [(0, '200.144')]
+[2023-03-09 14:41:36,778][744402] Updated weights for policy 0, policy_version 11360 (0.0005)
+[2023-03-09 14:41:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8874.7, 300 sec: 8844.6). Total num frames: 5832704. Throughput: 0: 8920.4. Samples: 5816392. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:41:38,995][744089] Avg episode reward: [(0, '268.498')]
+[2023-03-09 14:41:39,027][744358] Saving new best policy, reward=268.498!
+[2023-03-09 14:41:41,237][744402] Updated weights for policy 0, policy_version 11440 (0.0005)
+[2023-03-09 14:41:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 8844.6). Total num frames: 5877760. Throughput: 0: 8986.2. Samples: 5871000. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:41:44,006][744089] Avg episode reward: [(0, '273.385')]
+[2023-03-09 14:41:44,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000011480_5877760.pth...
+[2023-03-09 14:41:44,011][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000010952_5607424.pth
+[2023-03-09 14:41:44,011][744358] Saving new best policy, reward=273.385!
+[2023-03-09 14:41:46,194][744402] Updated weights for policy 0, policy_version 11520 (0.0004)
+[2023-03-09 14:41:48,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 8858.5). Total num frames: 5922816. Throughput: 0: 8912.3. Samples: 5922748. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:41:48,996][744089] Avg episode reward: [(0, '269.959')]
+[2023-03-09 14:41:50,880][744402] Updated weights for policy 0, policy_version 11600 (0.0006)
+[2023-03-09 14:41:53,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8874.7, 300 sec: 8844.6). Total num frames: 5963776. Throughput: 0: 8909.6. Samples: 5947384. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:41:53,995][744089] Avg episode reward: [(0, '244.555')]
+[2023-03-09 14:41:55,343][744402] Updated weights for policy 0, policy_version 11680 (0.0005)
+[2023-03-09 14:41:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8874.7, 300 sec: 8858.5). Total num frames: 6008832. Throughput: 0: 8933.6. Samples: 6001308. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:41:59,006][744089] Avg episode reward: [(0, '237.582')]
+[2023-03-09 14:41:59,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000011736_6008832.pth...
+[2023-03-09 14:41:59,010][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000011216_5742592.pth
+[2023-03-09 14:41:59,982][744402] Updated weights for policy 0, policy_version 11760 (0.0005)
+[2023-03-09 14:42:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 8872.4). Total num frames: 6053888. Throughput: 0: 8969.8. Samples: 6055496. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:42:03,995][744089] Avg episode reward: [(0, '251.140')]
+[2023-03-09 14:42:04,494][744402] Updated weights for policy 0, policy_version 11840 (0.0005)
+[2023-03-09 14:42:08,918][744402] Updated weights for policy 0, policy_version 11920 (0.0005)
+[2023-03-09 14:42:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 8886.2). Total num frames: 6103040. Throughput: 0: 8979.1. Samples: 6083220. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:42:08,995][744089] Avg episode reward: [(0, '216.591')]
+[2023-03-09 14:42:13,266][744402] Updated weights for policy 0, policy_version 12000 (0.0005)
+[2023-03-09 14:42:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 8900.1). Total num frames: 6148096. Throughput: 0: 9013.2. Samples: 6140068. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:42:13,995][744089] Avg episode reward: [(0, '280.369')]
+[2023-03-09 14:42:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000012008_6148096.pth...
+[2023-03-09 14:42:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000011480_5877760.pth
+[2023-03-09 14:42:14,000][744358] Saving new best policy, reward=280.369!
+[2023-03-09 14:42:17,741][744402] Updated weights for policy 0, policy_version 12080 (0.0006)
+[2023-03-09 14:42:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 8914.0). Total num frames: 6193152. Throughput: 0: 8998.6. Samples: 6195172. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:42:18,995][744089] Avg episode reward: [(0, '300.760')]
+[2023-03-09 14:42:18,996][744358] Saving new best policy, reward=300.760!
+[2023-03-09 14:42:22,052][744402] Updated weights for policy 0, policy_version 12160 (0.0006)
+[2023-03-09 14:42:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 8914.0). Total num frames: 6242304. Throughput: 0: 9062.1. Samples: 6224188. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:42:23,995][744089] Avg episode reward: [(0, '252.480')]
+[2023-03-09 14:42:26,260][744402] Updated weights for policy 0, policy_version 12240 (0.0005)
+[2023-03-09 14:42:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 8914.0). Total num frames: 6287360. Throughput: 0: 9077.5. Samples: 6279488. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:42:28,995][744089] Avg episode reward: [(0, '300.615')]
+[2023-03-09 14:42:28,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000012280_6287360.pth...
+[2023-03-09 14:42:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000011736_6008832.pth
+[2023-03-09 14:42:31,070][744402] Updated weights for policy 0, policy_version 12320 (0.0005)
+[2023-03-09 14:42:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 8927.9). Total num frames: 6332416. Throughput: 0: 9120.8. Samples: 6333184. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:42:33,996][744089] Avg episode reward: [(0, '313.521')]
+[2023-03-09 14:42:33,996][744358] Saving new best policy, reward=313.521!
+[2023-03-09 14:42:35,554][744402] Updated weights for policy 0, policy_version 12400 (0.0005)
+[2023-03-09 14:42:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 8927.9). Total num frames: 6377472. Throughput: 0: 9193.4. Samples: 6361088. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:42:38,995][744089] Avg episode reward: [(0, '310.285')]
+[2023-03-09 14:42:40,119][744402] Updated weights for policy 0, policy_version 12480 (0.0005)
+[2023-03-09 14:42:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 8927.9). Total num frames: 6422528. Throughput: 0: 9178.4. Samples: 6414336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:42:43,995][744089] Avg episode reward: [(0, '232.477')]
+[2023-03-09 14:42:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000012544_6422528.pth...
+[2023-03-09 14:42:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000012008_6148096.pth
+[2023-03-09 14:42:44,754][744402] Updated weights for policy 0, policy_version 12560 (0.0005)
+[2023-03-09 14:42:48,933][744402] Updated weights for policy 0, policy_version 12640 (0.0005)
+[2023-03-09 14:42:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 8941.8). Total num frames: 6471680. Throughput: 0: 9244.7. Samples: 6471508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:42:48,996][744089] Avg episode reward: [(0, '180.267')]
+[2023-03-09 14:42:53,253][744402] Updated weights for policy 0, policy_version 12720 (0.0004)
+[2023-03-09 14:42:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 8941.8). Total num frames: 6516736. Throughput: 0: 9235.3. Samples: 6498808. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:42:53,995][744089] Avg episode reward: [(0, '297.665')]
+[2023-03-09 14:42:57,812][744402] Updated weights for policy 0, policy_version 12800 (0.0005)
+[2023-03-09 14:42:58,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 8927.9). Total num frames: 6561792. Throughput: 0: 9191.0. Samples: 6553664. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:42:58,995][744089] Avg episode reward: [(0, '335.873')]
+[2023-03-09 14:42:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000012816_6561792.pth...
+[2023-03-09 14:42:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000012280_6287360.pth
+[2023-03-09 14:42:58,999][744358] Saving new best policy, reward=335.873!
+[2023-03-09 14:43:02,310][744402] Updated weights for policy 0, policy_version 12880 (0.0005)
+[2023-03-09 14:43:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 8927.9). Total num frames: 6606848. Throughput: 0: 9151.0. Samples: 6606968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:43:03,995][744089] Avg episode reward: [(0, '238.146')]
+[2023-03-09 14:43:06,787][744402] Updated weights for policy 0, policy_version 12960 (0.0005)
+[2023-03-09 14:43:08,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 8927.9). Total num frames: 6656000. Throughput: 0: 9142.1. Samples: 6635584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:43:08,996][744089] Avg episode reward: [(0, '302.198')]
+[2023-03-09 14:43:11,133][744402] Updated weights for policy 0, policy_version 13040 (0.0005)
+[2023-03-09 14:43:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 8927.9). Total num frames: 6701056. Throughput: 0: 9183.2. Samples: 6692732. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:43:13,996][744089] Avg episode reward: [(0, '299.557')]
+[2023-03-09 14:43:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000013088_6701056.pth...
+[2023-03-09 14:43:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000012544_6422528.pth
+[2023-03-09 14:43:15,525][744402] Updated weights for policy 0, policy_version 13120 (0.0005)
+[2023-03-09 14:43:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 8927.9). Total num frames: 6746112. Throughput: 0: 9212.5. Samples: 6747748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:43:18,996][744089] Avg episode reward: [(0, '371.468')]
+[2023-03-09 14:43:18,996][744358] Saving new best policy, reward=371.468!
+[2023-03-09 14:43:20,054][744402] Updated weights for policy 0, policy_version 13200 (0.0005)
+[2023-03-09 14:43:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 8941.8). Total num frames: 6795264. Throughput: 0: 9212.9. Samples: 6775668. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:43:23,995][744089] Avg episode reward: [(0, '395.571')]
+[2023-03-09 14:43:23,996][744358] Saving new best policy, reward=395.571!
+[2023-03-09 14:43:24,174][744402] Updated weights for policy 0, policy_version 13280 (0.0005)
+[2023-03-09 14:43:28,534][744402] Updated weights for policy 0, policy_version 13360 (0.0005)
+[2023-03-09 14:43:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9284.2, 300 sec: 8955.7). Total num frames: 6844416. Throughput: 0: 9302.6. Samples: 6832956. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:43:28,996][744089] Avg episode reward: [(0, '350.215')]
+[2023-03-09 14:43:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000013368_6844416.pth...
+[2023-03-09 14:43:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000012816_6561792.pth
+[2023-03-09 14:43:32,816][744402] Updated weights for policy 0, policy_version 13440 (0.0005)
+[2023-03-09 14:43:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 8955.7). Total num frames: 6889472. Throughput: 0: 9309.7. Samples: 6890444. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:43:33,995][744089] Avg episode reward: [(0, '364.875')]
+[2023-03-09 14:43:37,297][744402] Updated weights for policy 0, policy_version 13520 (0.0004)
+[2023-03-09 14:43:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.2, 300 sec: 8955.7). Total num frames: 6934528. Throughput: 0: 9320.0. Samples: 6918208. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:43:38,996][744089] Avg episode reward: [(0, '365.963')]
+[2023-03-09 14:43:41,833][744402] Updated weights for policy 0, policy_version 13600 (0.0005)
+[2023-03-09 14:43:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 8955.7). Total num frames: 6979584. Throughput: 0: 9295.9. Samples: 6971980. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:43:43,995][744089] Avg episode reward: [(0, '301.780')]
+[2023-03-09 14:43:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000013632_6979584.pth...
+[2023-03-09 14:43:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000013088_6701056.pth
+[2023-03-09 14:43:46,203][744402] Updated weights for policy 0, policy_version 13680 (0.0005)
+[2023-03-09 14:43:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 8983.4). Total num frames: 7028736. Throughput: 0: 9371.5. Samples: 7028684. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:43:48,995][744089] Avg episode reward: [(0, '265.428')]
+[2023-03-09 14:43:50,704][744402] Updated weights for policy 0, policy_version 13760 (0.0005)
+[2023-03-09 14:43:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 8983.4). Total num frames: 7073792. Throughput: 0: 9371.5. Samples: 7057300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:43:53,995][744089] Avg episode reward: [(0, '317.630')]
+[2023-03-09 14:43:55,067][744402] Updated weights for policy 0, policy_version 13840 (0.0004)
+[2023-03-09 14:43:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 8997.3). Total num frames: 7118848. Throughput: 0: 9297.8. Samples: 7111132. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:43:58,995][744089] Avg episode reward: [(0, '340.264')]
+[2023-03-09 14:43:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000013904_7118848.pth...
+[2023-03-09 14:43:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000013368_6844416.pth
+[2023-03-09 14:43:59,576][744402] Updated weights for policy 0, policy_version 13920 (0.0005)
+[2023-03-09 14:44:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9284.3, 300 sec: 8997.3). Total num frames: 7163904. Throughput: 0: 9267.0. Samples: 7164764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:44:03,995][744089] Avg episode reward: [(0, '371.934')]
+[2023-03-09 14:44:04,176][744402] Updated weights for policy 0, policy_version 14000 (0.0005)
+[2023-03-09 14:44:08,765][744402] Updated weights for policy 0, policy_version 14080 (0.0005)
+[2023-03-09 14:44:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 8997.3). Total num frames: 7208960. Throughput: 0: 9242.1. Samples: 7191564. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:44:08,995][744089] Avg episode reward: [(0, '327.103')]
+[2023-03-09 14:44:13,532][744402] Updated weights for policy 0, policy_version 14160 (0.0004)
+[2023-03-09 14:44:13,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9147.7, 300 sec: 8983.4). Total num frames: 7249920. Throughput: 0: 9147.3. Samples: 7244584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:44:13,995][744089] Avg episode reward: [(0, '373.300')]
+[2023-03-09 14:44:14,019][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000014168_7254016.pth...
+[2023-03-09 14:44:14,021][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000013632_6979584.pth
+[2023-03-09 14:44:18,119][744402] Updated weights for policy 0, policy_version 14240 (0.0005)
+[2023-03-09 14:44:18,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9147.7, 300 sec: 8997.3). Total num frames: 7294976. Throughput: 0: 9048.0. Samples: 7297604. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:44:18,995][744089] Avg episode reward: [(0, '378.767')]
+[2023-03-09 14:44:22,589][744402] Updated weights for policy 0, policy_version 14320 (0.0005)
+[2023-03-09 14:44:23,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9011.2). Total num frames: 7344128. Throughput: 0: 9052.9. Samples: 7325588. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:44:23,996][744089] Avg episode reward: [(0, '304.468')]
+[2023-03-09 14:44:26,676][744402] Updated weights for policy 0, policy_version 14400 (0.0005)
+[2023-03-09 14:44:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9147.7, 300 sec: 9039.0). Total num frames: 7393280. Throughput: 0: 9109.1. Samples: 7381892. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:44:28,996][744089] Avg episode reward: [(0, '440.429')]
+[2023-03-09 14:44:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000014440_7393280.pth...
+[2023-03-09 14:44:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000013904_7118848.pth
+[2023-03-09 14:44:29,002][744358] Saving new best policy, reward=440.429!
+[2023-03-09 14:44:31,342][744402] Updated weights for policy 0, policy_version 14480 (0.0005)
+[2023-03-09 14:44:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9039.0). Total num frames: 7434240. Throughput: 0: 9017.5. Samples: 7434472. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:44:33,995][744089] Avg episode reward: [(0, '381.658')]
+[2023-03-09 14:44:36,042][744402] Updated weights for policy 0, policy_version 14560 (0.0005)
+[2023-03-09 14:44:38,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 9039.0). Total num frames: 7479296. Throughput: 0: 8992.2. Samples: 7461948. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:44:38,995][744089] Avg episode reward: [(0, '358.205')]
+[2023-03-09 14:44:40,686][744402] Updated weights for policy 0, policy_version 14640 (0.0005)
+[2023-03-09 14:44:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.4, 300 sec: 9039.0). Total num frames: 7524352. Throughput: 0: 8985.8. Samples: 7515496. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:44:43,996][744089] Avg episode reward: [(0, '458.208')]
+[2023-03-09 14:44:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000014696_7524352.pth...
+[2023-03-09 14:44:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000014168_7254016.pth
+[2023-03-09 14:44:44,002][744358] Saving new best policy, reward=458.208!
+[2023-03-09 14:44:45,341][744402] Updated weights for policy 0, policy_version 14720 (0.0005)
+[2023-03-09 14:44:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9039.0). Total num frames: 7569408. Throughput: 0: 9004.0. Samples: 7569944. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:44:48,995][744089] Avg episode reward: [(0, '422.763')]
+[2023-03-09 14:44:49,688][744402] Updated weights for policy 0, policy_version 14800 (0.0005)
+[2023-03-09 14:44:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 7614464. Throughput: 0: 9003.3. Samples: 7596712. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:44:53,995][744089] Avg episode reward: [(0, '402.222')]
+[2023-03-09 14:44:54,070][744402] Updated weights for policy 0, policy_version 14880 (0.0005)
+[2023-03-09 14:44:58,661][744402] Updated weights for policy 0, policy_version 14960 (0.0005)
+[2023-03-09 14:44:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 7659520. Throughput: 0: 9040.2. Samples: 7651392. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:44:58,995][744089] Avg episode reward: [(0, '356.230')]
+[2023-03-09 14:44:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000014960_7659520.pth...
+[2023-03-09 14:44:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000014440_7393280.pth
+[2023-03-09 14:45:03,129][744402] Updated weights for policy 0, policy_version 15040 (0.0005)
+[2023-03-09 14:45:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 7708672. Throughput: 0: 9127.0. Samples: 7708320. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:45:03,996][744089] Avg episode reward: [(0, '390.305')]
+[2023-03-09 14:45:07,735][744402] Updated weights for policy 0, policy_version 15120 (0.0005)
+[2023-03-09 14:45:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 7749632. Throughput: 0: 9061.4. Samples: 7733348. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:45:08,995][744089] Avg episode reward: [(0, '393.485')]
+[2023-03-09 14:45:12,416][744402] Updated weights for policy 0, policy_version 15200 (0.0005)
+[2023-03-09 14:45:13,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9052.9). Total num frames: 7794688. Throughput: 0: 8991.2. Samples: 7786496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:45:13,996][744089] Avg episode reward: [(0, '392.640')]
+[2023-03-09 14:45:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000015224_7794688.pth...
+[2023-03-09 14:45:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000014696_7524352.pth
+[2023-03-09 14:45:17,013][744402] Updated weights for policy 0, policy_version 15280 (0.0004)
+[2023-03-09 14:45:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9052.9). Total num frames: 7839744. Throughput: 0: 8997.3. Samples: 7839348. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:45:18,995][744089] Avg episode reward: [(0, '415.194')]
+[2023-03-09 14:45:21,784][744402] Updated weights for policy 0, policy_version 15360 (0.0005)
+[2023-03-09 14:45:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 7884800. Throughput: 0: 8943.2. Samples: 7864392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:45:23,995][744089] Avg episode reward: [(0, '396.817')]
+[2023-03-09 14:45:26,190][744402] Updated weights for policy 0, policy_version 15440 (0.0005)
+[2023-03-09 14:45:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9080.6). Total num frames: 7929856. Throughput: 0: 9025.2. Samples: 7921628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:45:28,995][744089] Avg episode reward: [(0, '422.655')]
+[2023-03-09 14:45:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000015488_7929856.pth...
+[2023-03-09 14:45:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000014960_7659520.pth
+[2023-03-09 14:45:30,672][744402] Updated weights for policy 0, policy_version 15520 (0.0004)
+[2023-03-09 14:45:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 7974912. Throughput: 0: 8995.3. Samples: 7974732. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:45:33,996][744089] Avg episode reward: [(0, '435.986')]
+[2023-03-09 14:45:35,234][744402] Updated weights for policy 0, policy_version 15600 (0.0005)
+[2023-03-09 14:45:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 8019968. Throughput: 0: 8994.7. Samples: 8001472. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:45:38,996][744089] Avg episode reward: [(0, '460.100')]
+[2023-03-09 14:45:38,996][744358] Saving new best policy, reward=460.100!
+[2023-03-09 14:45:39,805][744402] Updated weights for policy 0, policy_version 15680 (0.0005)
+[2023-03-09 14:45:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 8065024. Throughput: 0: 8968.8. Samples: 8054988. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:45:43,996][744089] Avg episode reward: [(0, '410.360')]
+[2023-03-09 14:45:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000015752_8065024.pth...
+[2023-03-09 14:45:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000015224_7794688.pth
+[2023-03-09 14:45:44,462][744402] Updated weights for policy 0, policy_version 15760 (0.0004)
+[2023-03-09 14:45:48,927][744402] Updated weights for policy 0, policy_version 15840 (0.0005)
+[2023-03-09 14:45:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 8110080. Throughput: 0: 8918.3. Samples: 8109644. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:45:48,996][744089] Avg episode reward: [(0, '396.562')]
+[2023-03-09 14:45:53,648][744402] Updated weights for policy 0, policy_version 15920 (0.0005)
+[2023-03-09 14:45:53,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8942.9, 300 sec: 9066.7). Total num frames: 8151040. Throughput: 0: 8919.4. Samples: 8134720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:45:53,995][744089] Avg episode reward: [(0, '384.816')]
+[2023-03-09 14:45:58,149][744402] Updated weights for policy 0, policy_version 16000 (0.0005)
+[2023-03-09 14:45:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8942.9, 300 sec: 9066.7). Total num frames: 8196096. Throughput: 0: 8939.3. Samples: 8188764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:45:58,995][744089] Avg episode reward: [(0, '377.953')]
+[2023-03-09 14:45:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000016008_8196096.pth...
+[2023-03-09 14:45:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000015488_7929856.pth
+[2023-03-09 14:46:02,836][744402] Updated weights for policy 0, policy_version 16080 (0.0006)
+[2023-03-09 14:46:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 9080.6). Total num frames: 8241152. Throughput: 0: 8932.8. Samples: 8241324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:46:03,995][744089] Avg episode reward: [(0, '303.297')]
+[2023-03-09 14:46:07,276][744402] Updated weights for policy 0, policy_version 16160 (0.0005)
+[2023-03-09 14:46:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9080.6). Total num frames: 8286208. Throughput: 0: 9009.9. Samples: 8269840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:46:08,995][744089] Avg episode reward: [(0, '235.806')]
+[2023-03-09 14:46:11,773][744402] Updated weights for policy 0, policy_version 16240 (0.0005)
+[2023-03-09 14:46:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 9080.6). Total num frames: 8331264. Throughput: 0: 8922.6. Samples: 8323144. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:46:13,996][744089] Avg episode reward: [(0, '336.007')]
+[2023-03-09 14:46:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000016272_8331264.pth...
+[2023-03-09 14:46:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000015752_8065024.pth
+[2023-03-09 14:46:16,516][744402] Updated weights for policy 0, policy_version 16320 (0.0005)
+[2023-03-09 14:46:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 8380416. Throughput: 0: 9015.4. Samples: 8380424. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:46:18,996][744089] Avg episode reward: [(0, '379.134')]
+[2023-03-09 14:46:20,440][744402] Updated weights for policy 0, policy_version 16400 (0.0006)
+[2023-03-09 14:46:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 8425472. Throughput: 0: 9058.3. Samples: 8409096. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:46:23,995][744089] Avg episode reward: [(0, '404.178')]
+[2023-03-09 14:46:24,801][744402] Updated weights for policy 0, policy_version 16480 (0.0005)
+[2023-03-09 14:46:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 8470528. Throughput: 0: 9079.1. Samples: 8463548. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:46:28,995][744089] Avg episode reward: [(0, '347.391')]
+[2023-03-09 14:46:29,023][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000016552_8474624.pth...
+[2023-03-09 14:46:29,025][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000016008_8196096.pth
+[2023-03-09 14:46:29,442][744402] Updated weights for policy 0, policy_version 16560 (0.0005)
+[2023-03-09 14:46:33,955][744402] Updated weights for policy 0, policy_version 16640 (0.0005)
+[2023-03-09 14:46:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 8519680. Throughput: 0: 9103.0. Samples: 8519280. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:46:33,995][744089] Avg episode reward: [(0, '378.979')]
+[2023-03-09 14:46:38,486][744402] Updated weights for policy 0, policy_version 16720 (0.0005)
+[2023-03-09 14:46:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 8564736. Throughput: 0: 9136.5. Samples: 8545864. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:46:38,995][744089] Avg episode reward: [(0, '388.099')]
+[2023-03-09 14:46:43,065][744402] Updated weights for policy 0, policy_version 16800 (0.0004)
+[2023-03-09 14:46:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 8609792. Throughput: 0: 9133.0. Samples: 8599748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:46:43,996][744089] Avg episode reward: [(0, '384.643')]
+[2023-03-09 14:46:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000016816_8609792.pth...
+[2023-03-09 14:46:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000016272_8331264.pth
+[2023-03-09 14:46:47,569][744402] Updated weights for policy 0, policy_version 16880 (0.0005)
+[2023-03-09 14:46:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 8654848. Throughput: 0: 9176.5. Samples: 8654268. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:46:48,995][744089] Avg episode reward: [(0, '371.819')]
+[2023-03-09 14:46:52,116][744402] Updated weights for policy 0, policy_version 16960 (0.0005)
+[2023-03-09 14:46:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 8699904. Throughput: 0: 9148.6. Samples: 8681528. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:46:53,996][744089] Avg episode reward: [(0, '416.289')]
+[2023-03-09 14:46:56,562][744402] Updated weights for policy 0, policy_version 17040 (0.0004)
+[2023-03-09 14:46:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 8744960. Throughput: 0: 9185.4. Samples: 8736488. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:46:58,996][744089] Avg episode reward: [(0, '425.705')]
+[2023-03-09 14:46:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000017080_8744960.pth...
+[2023-03-09 14:46:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000016552_8474624.pth
+[2023-03-09 14:47:00,987][744402] Updated weights for policy 0, policy_version 17120 (0.0005)
+[2023-03-09 14:47:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 8794112. Throughput: 0: 9193.3. Samples: 8794120. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:47:03,995][744089] Avg episode reward: [(0, '443.024')]
+[2023-03-09 14:47:05,208][744402] Updated weights for policy 0, policy_version 17200 (0.0005)
+[2023-03-09 14:47:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 8839168. Throughput: 0: 9190.1. Samples: 8822652. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:47:08,995][744089] Avg episode reward: [(0, '427.795')]
+[2023-03-09 14:47:09,594][744402] Updated weights for policy 0, policy_version 17280 (0.0005)
+[2023-03-09 14:47:13,952][744402] Updated weights for policy 0, policy_version 17360 (0.0005)
+[2023-03-09 14:47:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 8888320. Throughput: 0: 9205.1. Samples: 8877780. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:47:13,996][744089] Avg episode reward: [(0, '442.675')]
+[2023-03-09 14:47:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000017360_8888320.pth...
+[2023-03-09 14:47:14,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000016816_8609792.pth
+[2023-03-09 14:47:18,539][744402] Updated weights for policy 0, policy_version 17440 (0.0005)
+[2023-03-09 14:47:18,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 8933376. Throughput: 0: 9177.7. Samples: 8932276. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:47:18,995][744089] Avg episode reward: [(0, '428.460')]
+[2023-03-09 14:47:23,080][744402] Updated weights for policy 0, policy_version 17520 (0.0005)
+[2023-03-09 14:47:23,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 8974336. Throughput: 0: 9176.6. Samples: 8958812. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:47:23,995][744089] Avg episode reward: [(0, '453.487')]
+[2023-03-09 14:47:27,683][744402] Updated weights for policy 0, policy_version 17600 (0.0005)
+[2023-03-09 14:47:28,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 9019392. Throughput: 0: 9161.7. Samples: 9012024. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:47:28,995][744089] Avg episode reward: [(0, '399.381')]
+[2023-03-09 14:47:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000017616_9019392.pth...
+[2023-03-09 14:47:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000017080_8744960.pth
+[2023-03-09 14:47:32,220][744402] Updated weights for policy 0, policy_version 17680 (0.0004)
+[2023-03-09 14:47:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 9068544. Throughput: 0: 9227.7. Samples: 9069516. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:47:33,995][744089] Avg episode reward: [(0, '391.937')]
+[2023-03-09 14:47:36,353][744402] Updated weights for policy 0, policy_version 17760 (0.0005)
+[2023-03-09 14:47:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 9113600. Throughput: 0: 9238.9. Samples: 9097280. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:47:38,995][744089] Avg episode reward: [(0, '405.959')]
+[2023-03-09 14:47:40,788][744402] Updated weights for policy 0, policy_version 17840 (0.0006)
+[2023-03-09 14:47:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 9162752. Throughput: 0: 9250.3. Samples: 9152752. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:47:43,995][744089] Avg episode reward: [(0, '414.052')]
+[2023-03-09 14:47:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000017896_9162752.pth...
+[2023-03-09 14:47:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000017360_8888320.pth
+[2023-03-09 14:47:45,090][744402] Updated weights for policy 0, policy_version 17920 (0.0006)
+[2023-03-09 14:47:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 9211904. Throughput: 0: 9301.1. Samples: 9212672. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:47:48,996][744089] Avg episode reward: [(0, '368.554')]
+[2023-03-09 14:47:49,075][744402] Updated weights for policy 0, policy_version 18000 (0.0005)
+[2023-03-09 14:47:53,640][744402] Updated weights for policy 0, policy_version 18080 (0.0006)
+[2023-03-09 14:47:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 9256960. Throughput: 0: 9287.0. Samples: 9240568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:47:53,995][744089] Avg episode reward: [(0, '405.988')]
+[2023-03-09 14:47:57,854][744402] Updated weights for policy 0, policy_version 18160 (0.0005)
+[2023-03-09 14:47:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9150.0). Total num frames: 9306112. Throughput: 0: 9336.4. Samples: 9297916. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:47:58,995][744089] Avg episode reward: [(0, '398.337')]
+[2023-03-09 14:47:59,033][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000018184_9310208.pth...
+[2023-03-09 14:47:59,035][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000017616_9019392.pth
+[2023-03-09 14:48:02,327][744402] Updated weights for policy 0, policy_version 18240 (0.0005)
+[2023-03-09 14:48:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 9351168. Throughput: 0: 9335.0. Samples: 9352352. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:48:03,995][744089] Avg episode reward: [(0, '415.930')]
+[2023-03-09 14:48:06,978][744402] Updated weights for policy 0, policy_version 18320 (0.0004)
+[2023-03-09 14:48:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 9396224. Throughput: 0: 9348.3. Samples: 9379488. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:48:08,995][744089] Avg episode reward: [(0, '457.798')]
+[2023-03-09 14:48:11,442][744402] Updated weights for policy 0, policy_version 18400 (0.0005)
+[2023-03-09 14:48:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 9441280. Throughput: 0: 9358.6. Samples: 9433160. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:48:13,995][744089] Avg episode reward: [(0, '416.796')]
+[2023-03-09 14:48:14,037][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000018448_9445376.pth...
+[2023-03-09 14:48:14,039][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000017896_9162752.pth
+[2023-03-09 14:48:16,001][744402] Updated weights for policy 0, policy_version 18480 (0.0004)
+[2023-03-09 14:48:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 9486336. Throughput: 0: 9276.4. Samples: 9486956. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:48:18,995][744089] Avg episode reward: [(0, '444.698')]
+[2023-03-09 14:48:20,718][744402] Updated weights for policy 0, policy_version 18560 (0.0005)
+[2023-03-09 14:48:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9122.3). Total num frames: 9535488. Throughput: 0: 9223.5. Samples: 9512340. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:48:23,995][744089] Avg episode reward: [(0, '455.389')]
+[2023-03-09 14:48:24,843][744402] Updated weights for policy 0, policy_version 18640 (0.0005)
+[2023-03-09 14:48:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9122.3). Total num frames: 9580544. Throughput: 0: 9324.7. Samples: 9572364. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:48:28,995][744089] Avg episode reward: [(0, '459.782')]
+[2023-03-09 14:48:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000018712_9580544.pth...
+[2023-03-09 14:48:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000018184_9310208.pth
+[2023-03-09 14:48:29,168][744402] Updated weights for policy 0, policy_version 18720 (0.0005)
+[2023-03-09 14:48:33,689][744402] Updated weights for policy 0, policy_version 18800 (0.0005)
+[2023-03-09 14:48:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9122.3). Total num frames: 9625600. Throughput: 0: 9197.5. Samples: 9626560. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:48:33,995][744089] Avg episode reward: [(0, '465.956')]
+[2023-03-09 14:48:33,996][744358] Saving new best policy, reward=465.956!
+[2023-03-09 14:48:38,234][744402] Updated weights for policy 0, policy_version 18880 (0.0005)
+[2023-03-09 14:48:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9122.3). Total num frames: 9670656. Throughput: 0: 9181.7. Samples: 9653744. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:48:38,996][744089] Avg episode reward: [(0, '417.920')]
+[2023-03-09 14:48:42,905][744402] Updated weights for policy 0, policy_version 18960 (0.0005)
+[2023-03-09 14:48:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 9715712. Throughput: 0: 9095.8. Samples: 9707228. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:48:43,996][744089] Avg episode reward: [(0, '407.068')]
+[2023-03-09 14:48:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000018976_9715712.pth...
+[2023-03-09 14:48:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000018448_9445376.pth
+[2023-03-09 14:48:47,225][744402] Updated weights for policy 0, policy_version 19040 (0.0005)
+[2023-03-09 14:48:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 9760768. Throughput: 0: 9125.6. Samples: 9763004. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:48:48,996][744089] Avg episode reward: [(0, '418.084')]
+[2023-03-09 14:48:51,681][744402] Updated weights for policy 0, policy_version 19120 (0.0005)
+[2023-03-09 14:48:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 9805824. Throughput: 0: 9131.6. Samples: 9790408. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:48:53,995][744089] Avg episode reward: [(0, '441.705')]
+[2023-03-09 14:48:56,289][744402] Updated weights for policy 0, policy_version 19200 (0.0005)
+[2023-03-09 14:48:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 9850880. Throughput: 0: 9135.0. Samples: 9844236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:48:58,995][744089] Avg episode reward: [(0, '436.097')]
+[2023-03-09 14:48:59,041][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000019248_9854976.pth...
+[2023-03-09 14:48:59,042][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000018712_9580544.pth
+[2023-03-09 14:49:00,732][744402] Updated weights for policy 0, policy_version 19280 (0.0005)
+[2023-03-09 14:49:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 9900032. Throughput: 0: 9179.6. Samples: 9900040. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:49:04,006][744089] Avg episode reward: [(0, '446.488')]
+[2023-03-09 14:49:05,229][744402] Updated weights for policy 0, policy_version 19360 (0.0005)
+[2023-03-09 14:49:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.8, 300 sec: 9136.2). Total num frames: 9945088. Throughput: 0: 9209.9. Samples: 9926784. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:49:08,995][744089] Avg episode reward: [(0, '434.448')]
+[2023-03-09 14:49:09,751][744402] Updated weights for policy 0, policy_version 19440 (0.0005)
+[2023-03-09 14:49:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 9990144. Throughput: 0: 9101.9. Samples: 9981952. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:49:13,995][744089] Avg episode reward: [(0, '423.934')]
+[2023-03-09 14:49:14,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000019512_9990144.pth...
+[2023-03-09 14:49:14,011][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000018976_9715712.pth
+[2023-03-09 14:49:14,076][744402] Updated weights for policy 0, policy_version 19520 (0.0005)
+[2023-03-09 14:49:18,218][744402] Updated weights for policy 0, policy_version 19600 (0.0005)
+[2023-03-09 14:49:18,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 10039296. Throughput: 0: 9201.5. Samples: 10040628. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:49:18,995][744089] Avg episode reward: [(0, '429.493')]
+[2023-03-09 14:49:22,607][744402] Updated weights for policy 0, policy_version 19680 (0.0005)
+[2023-03-09 14:49:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 10084352. Throughput: 0: 9205.3. Samples: 10067980. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:49:23,995][744089] Avg episode reward: [(0, '398.396')]
+[2023-03-09 14:49:27,224][744402] Updated weights for policy 0, policy_version 19760 (0.0005)
+[2023-03-09 14:49:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 10133504. Throughput: 0: 9220.1. Samples: 10122132. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:49:29,006][744089] Avg episode reward: [(0, '464.484')]
+[2023-03-09 14:49:29,010][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000019792_10133504.pth...
+[2023-03-09 14:49:29,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000019248_9854976.pth
+[2023-03-09 14:49:31,697][744402] Updated weights for policy 0, policy_version 19840 (0.0005)
+[2023-03-09 14:49:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 10178560. Throughput: 0: 9234.8. Samples: 10178568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:49:33,996][744089] Avg episode reward: [(0, '451.362')]
+[2023-03-09 14:49:35,992][744402] Updated weights for policy 0, policy_version 19920 (0.0005)
+[2023-03-09 14:49:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9150.1). Total num frames: 10223616. Throughput: 0: 9248.5. Samples: 10206592. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:49:38,995][744089] Avg episode reward: [(0, '423.575')]
+[2023-03-09 14:49:40,540][744402] Updated weights for policy 0, policy_version 20000 (0.0005)
+[2023-03-09 14:49:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 10268672. Throughput: 0: 9248.8. Samples: 10260432. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:49:43,995][744089] Avg episode reward: [(0, '461.040')]
+[2023-03-09 14:49:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000020056_10268672.pth...
+[2023-03-09 14:49:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000019512_9990144.pth
+[2023-03-09 14:49:45,157][744402] Updated weights for policy 0, policy_version 20080 (0.0005)
+[2023-03-09 14:49:48,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 10309632. Throughput: 0: 9162.9. Samples: 10312368. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:49:48,995][744089] Avg episode reward: [(0, '465.712')]
+[2023-03-09 14:49:49,797][744402] Updated weights for policy 0, policy_version 20160 (0.0005)
+[2023-03-09 14:49:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 10358784. Throughput: 0: 9216.3. Samples: 10341520. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:49:53,995][744089] Avg episode reward: [(0, '455.354')]
+[2023-03-09 14:49:54,129][744402] Updated weights for policy 0, policy_version 20240 (0.0005)
+[2023-03-09 14:49:58,499][744402] Updated weights for policy 0, policy_version 20320 (0.0005)
+[2023-03-09 14:49:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9284.3, 300 sec: 9150.0). Total num frames: 10407936. Throughput: 0: 9203.0. Samples: 10396088. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:49:58,996][744089] Avg episode reward: [(0, '455.601')]
+[2023-03-09 14:49:59,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000020328_10407936.pth...
+[2023-03-09 14:49:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000019792_10133504.pth
+[2023-03-09 14:50:03,192][744402] Updated weights for policy 0, policy_version 20400 (0.0005)
+[2023-03-09 14:50:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9150.0). Total num frames: 10448896. Throughput: 0: 9107.0. Samples: 10450444. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:50:03,995][744089] Avg episode reward: [(0, '465.897')]
+[2023-03-09 14:50:07,613][744402] Updated weights for policy 0, policy_version 20480 (0.0005)
+[2023-03-09 14:50:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 10498048. Throughput: 0: 9109.8. Samples: 10477920. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:50:08,996][744089] Avg episode reward: [(0, '460.397')]
+[2023-03-09 14:50:12,067][744402] Updated weights for policy 0, policy_version 20560 (0.0005)
+[2023-03-09 14:50:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 10543104. Throughput: 0: 9153.3. Samples: 10534028. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:50:13,998][744089] Avg episode reward: [(0, '405.690')]
+[2023-03-09 14:50:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000020592_10543104.pth...
+[2023-03-09 14:50:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000020056_10268672.pth
+[2023-03-09 14:50:16,279][744402] Updated weights for policy 0, policy_version 20640 (0.0005)
+[2023-03-09 14:50:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 10592256. Throughput: 0: 9188.4. Samples: 10592044. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:50:18,995][744089] Avg episode reward: [(0, '459.996')]
+[2023-03-09 14:50:20,572][744402] Updated weights for policy 0, policy_version 20720 (0.0005)
+[2023-03-09 14:50:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 10637312. Throughput: 0: 9209.1. Samples: 10621000. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:50:23,995][744089] Avg episode reward: [(0, '422.164')]
+[2023-03-09 14:50:24,993][744402] Updated weights for policy 0, policy_version 20800 (0.0005)
+[2023-03-09 14:50:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 10682368. Throughput: 0: 9195.9. Samples: 10674248. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:50:28,996][744089] Avg episode reward: [(0, '458.981')]
+[2023-03-09 14:50:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000020864_10682368.pth...
+[2023-03-09 14:50:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000020328_10407936.pth
+[2023-03-09 14:50:29,655][744402] Updated weights for policy 0, policy_version 20880 (0.0006)
+[2023-03-09 14:50:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 10727424. Throughput: 0: 9224.9. Samples: 10727488. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:50:33,995][744089] Avg episode reward: [(0, '384.416')]
+[2023-03-09 14:50:34,204][744402] Updated weights for policy 0, policy_version 20960 (0.0005)
+[2023-03-09 14:50:38,622][744402] Updated weights for policy 0, policy_version 21040 (0.0005)
+[2023-03-09 14:50:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 10772480. Throughput: 0: 9210.9. Samples: 10756008. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:50:38,995][744089] Avg episode reward: [(0, '403.443')]
+[2023-03-09 14:50:43,178][744402] Updated weights for policy 0, policy_version 21120 (0.0005)
+[2023-03-09 14:50:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9191.7). Total num frames: 10821632. Throughput: 0: 9185.8. Samples: 10809448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:50:43,996][744089] Avg episode reward: [(0, '424.464')]
+[2023-03-09 14:50:44,001][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000021136_10821632.pth...
+[2023-03-09 14:50:44,004][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000020592_10543104.pth
+[2023-03-09 14:50:47,340][744402] Updated weights for policy 0, policy_version 21200 (0.0005)
+[2023-03-09 14:50:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9205.6). Total num frames: 10866688. Throughput: 0: 9266.4. Samples: 10867432. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:50:48,995][744089] Avg episode reward: [(0, '483.338')]
+[2023-03-09 14:50:48,996][744358] Saving new best policy, reward=483.338!
+[2023-03-09 14:50:51,819][744402] Updated weights for policy 0, policy_version 21280 (0.0005)
+[2023-03-09 14:50:53,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9216.0, 300 sec: 9205.6). Total num frames: 10911744. Throughput: 0: 9276.6. Samples: 10895368. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:50:53,995][744089] Avg episode reward: [(0, '411.446')]
+[2023-03-09 14:50:56,230][744402] Updated weights for policy 0, policy_version 21360 (0.0005)
+[2023-03-09 14:50:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9219.5). Total num frames: 10960896. Throughput: 0: 9279.2. Samples: 10951592. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:50:58,996][744089] Avg episode reward: [(0, '462.875')]
+[2023-03-09 14:50:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000021408_10960896.pth...
+[2023-03-09 14:50:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000020864_10682368.pth
+[2023-03-09 14:51:00,842][744402] Updated weights for policy 0, policy_version 21440 (0.0005)
+[2023-03-09 14:51:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9219.5). Total num frames: 11005952. Throughput: 0: 9169.3. Samples: 11004660. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:51:03,995][744089] Avg episode reward: [(0, '483.695')]
+[2023-03-09 14:51:03,996][744358] Saving new best policy, reward=483.695!
+[2023-03-09 14:51:05,349][744402] Updated weights for policy 0, policy_version 21520 (0.0004)
+[2023-03-09 14:51:08,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9147.7, 300 sec: 9205.6). Total num frames: 11046912. Throughput: 0: 9108.4. Samples: 11030880. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:51:08,995][744089] Avg episode reward: [(0, '462.948')]
+[2023-03-09 14:51:10,065][744402] Updated weights for policy 0, policy_version 21600 (0.0005)
+[2023-03-09 14:51:13,995][744089] Fps is (10 sec: 8601.4, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 11091968. Throughput: 0: 9099.8. Samples: 11083740. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:51:13,996][744089] Avg episode reward: [(0, '470.162')]
+[2023-03-09 14:51:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000021664_11091968.pth...
+[2023-03-09 14:51:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000021136_10821632.pth
+[2023-03-09 14:51:14,580][744402] Updated weights for policy 0, policy_version 21680 (0.0005)
+[2023-03-09 14:51:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 11137024. Throughput: 0: 9101.0. Samples: 11137032. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:51:18,995][744089] Avg episode reward: [(0, '436.904')]
+[2023-03-09 14:51:19,250][744402] Updated weights for policy 0, policy_version 21760 (0.0005)
+[2023-03-09 14:51:23,857][744402] Updated weights for policy 0, policy_version 21840 (0.0005)
+[2023-03-09 14:51:23,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 11182080. Throughput: 0: 9064.5. Samples: 11163912. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:51:23,995][744089] Avg episode reward: [(0, '426.304')]
+[2023-03-09 14:51:28,404][744402] Updated weights for policy 0, policy_version 21920 (0.0005)
+[2023-03-09 14:51:28,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 11227136. Throughput: 0: 9098.1. Samples: 11218864. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:51:28,996][744089] Avg episode reward: [(0, '433.564')]
+[2023-03-09 14:51:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000021928_11227136.pth...
+[2023-03-09 14:51:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000021408_10960896.pth
+[2023-03-09 14:51:32,870][744402] Updated weights for policy 0, policy_version 22000 (0.0005)
+[2023-03-09 14:51:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 11272192. Throughput: 0: 9013.4. Samples: 11273036. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:51:33,995][744089] Avg episode reward: [(0, '462.924')]
+[2023-03-09 14:51:37,032][744402] Updated weights for policy 0, policy_version 22080 (0.0005)
+[2023-03-09 14:51:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 11321344. Throughput: 0: 9064.2. Samples: 11303256. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:51:38,996][744089] Avg episode reward: [(0, '463.477')]
+[2023-03-09 14:51:41,657][744402] Updated weights for policy 0, policy_version 22160 (0.0005)
+[2023-03-09 14:51:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 11362304. Throughput: 0: 8983.0. Samples: 11355828. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:51:43,995][744089] Avg episode reward: [(0, '433.261')]
+[2023-03-09 14:51:44,021][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000022200_11366400.pth...
+[2023-03-09 14:51:44,023][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000021664_11091968.pth
+[2023-03-09 14:51:46,132][744402] Updated weights for policy 0, policy_version 22240 (0.0005)
+[2023-03-09 14:51:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 11411456. Throughput: 0: 9054.3. Samples: 11412104. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 14:51:48,996][744089] Avg episode reward: [(0, '442.893')]
+[2023-03-09 14:51:50,441][744402] Updated weights for policy 0, policy_version 22320 (0.0005)
+[2023-03-09 14:51:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 11456512. Throughput: 0: 9092.5. Samples: 11440040. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:51:53,995][744089] Avg episode reward: [(0, '457.676')]
+[2023-03-09 14:51:54,959][744402] Updated weights for policy 0, policy_version 22400 (0.0004)
+[2023-03-09 14:51:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 11505664. Throughput: 0: 9158.8. Samples: 11495884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:51:58,996][744089] Avg episode reward: [(0, '457.406')]
+[2023-03-09 14:51:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000022472_11505664.pth...
+[2023-03-09 14:51:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000021928_11227136.pth
+[2023-03-09 14:51:59,441][744402] Updated weights for policy 0, policy_version 22480 (0.0005)
+[2023-03-09 14:52:03,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 11546624. Throughput: 0: 9155.5. Samples: 11549032. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:03,996][744089] Avg episode reward: [(0, '472.626')]
+[2023-03-09 14:52:04,049][744402] Updated weights for policy 0, policy_version 22560 (0.0005)
+[2023-03-09 14:52:08,668][744402] Updated weights for policy 0, policy_version 22640 (0.0005)
+[2023-03-09 14:52:08,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 11591680. Throughput: 0: 9143.3. Samples: 11575360. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:52:08,995][744089] Avg episode reward: [(0, '495.499')]
+[2023-03-09 14:52:08,996][744358] Saving new best policy, reward=495.499!
+[2023-03-09 14:52:13,304][744402] Updated weights for policy 0, policy_version 22720 (0.0005)
+[2023-03-09 14:52:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 11636736. Throughput: 0: 9103.8. Samples: 11628532. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:52:13,995][744089] Avg episode reward: [(0, '438.216')]
+[2023-03-09 14:52:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000022728_11636736.pth...
+[2023-03-09 14:52:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000022200_11366400.pth
+[2023-03-09 14:52:17,747][744402] Updated weights for policy 0, policy_version 22800 (0.0005)
+[2023-03-09 14:52:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 11681792. Throughput: 0: 9126.8. Samples: 11683744. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 14:52:18,995][744089] Avg episode reward: [(0, '417.017')]
+[2023-03-09 14:52:22,332][744402] Updated weights for policy 0, policy_version 22880 (0.0005)
+[2023-03-09 14:52:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.4, 300 sec: 9177.8). Total num frames: 11726848. Throughput: 0: 9045.9. Samples: 11710320. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:23,995][744089] Avg episode reward: [(0, '434.339')]
+[2023-03-09 14:52:26,903][744402] Updated weights for policy 0, policy_version 22960 (0.0005)
+[2023-03-09 14:52:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 11771904. Throughput: 0: 9081.0. Samples: 11764472. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:28,995][744089] Avg episode reward: [(0, '430.237')]
+[2023-03-09 14:52:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000022992_11771904.pth...
+[2023-03-09 14:52:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000022472_11505664.pth
+[2023-03-09 14:52:31,481][744402] Updated weights for policy 0, policy_version 23040 (0.0006)
+[2023-03-09 14:52:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 11816960. Throughput: 0: 8995.8. Samples: 11816916. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:33,996][744089] Avg episode reward: [(0, '463.671')]
+[2023-03-09 14:52:36,360][744402] Updated weights for policy 0, policy_version 23120 (0.0004)
+[2023-03-09 14:52:38,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8943.0, 300 sec: 9136.2). Total num frames: 11857920. Throughput: 0: 8923.6. Samples: 11841600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:38,995][744089] Avg episode reward: [(0, '475.072')]
+[2023-03-09 14:52:40,922][744402] Updated weights for policy 0, policy_version 23200 (0.0005)
+[2023-03-09 14:52:43,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 11902976. Throughput: 0: 8892.2. Samples: 11896032. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:43,995][744089] Avg episode reward: [(0, '472.927')]
+[2023-03-09 14:52:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000023248_11902976.pth...
+[2023-03-09 14:52:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000022728_11636736.pth
+[2023-03-09 14:52:45,324][744402] Updated weights for policy 0, policy_version 23280 (0.0005)
+[2023-03-09 14:52:48,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 11952128. Throughput: 0: 8956.0. Samples: 11952052. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:48,996][744089] Avg episode reward: [(0, '417.731')]
+[2023-03-09 14:52:49,787][744402] Updated weights for policy 0, policy_version 23360 (0.0005)
+[2023-03-09 14:52:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 11997184. Throughput: 0: 8974.1. Samples: 11979192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:53,995][744089] Avg episode reward: [(0, '394.619')]
+[2023-03-09 14:52:54,411][744402] Updated weights for policy 0, policy_version 23440 (0.0005)
+[2023-03-09 14:52:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8874.7, 300 sec: 9108.4). Total num frames: 12038144. Throughput: 0: 8955.9. Samples: 12031548. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:52:58,996][744089] Avg episode reward: [(0, '431.332')]
+[2023-03-09 14:52:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000023512_12038144.pth...
+[2023-03-09 14:52:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000022992_11771904.pth
+[2023-03-09 14:52:59,050][744402] Updated weights for policy 0, policy_version 23520 (0.0005)
+[2023-03-09 14:53:03,491][744402] Updated weights for policy 0, policy_version 23600 (0.0005)
+[2023-03-09 14:53:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 12087296. Throughput: 0: 8954.5. Samples: 12086696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:03,995][744089] Avg episode reward: [(0, '450.893')]
+[2023-03-09 14:53:08,106][744402] Updated weights for policy 0, policy_version 23680 (0.0004)
+[2023-03-09 14:53:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 12128256. Throughput: 0: 8941.3. Samples: 12112680. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:53:08,996][744089] Avg episode reward: [(0, '351.747')]
+[2023-03-09 14:53:12,722][744402] Updated weights for policy 0, policy_version 23760 (0.0005)
+[2023-03-09 14:53:13,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 12173312. Throughput: 0: 8917.8. Samples: 12165772. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:53:13,995][744089] Avg episode reward: [(0, '381.814')]
+[2023-03-09 14:53:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000023776_12173312.pth...
+[2023-03-09 14:53:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000023248_11902976.pth
+[2023-03-09 14:53:17,191][744402] Updated weights for policy 0, policy_version 23840 (0.0005)
+[2023-03-09 14:53:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 12222464. Throughput: 0: 9004.9. Samples: 12222136. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:53:18,996][744089] Avg episode reward: [(0, '430.458')]
+[2023-03-09 14:53:21,548][744402] Updated weights for policy 0, policy_version 23920 (0.0005)
+[2023-03-09 14:53:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 12267520. Throughput: 0: 9065.5. Samples: 12249548. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:23,995][744089] Avg episode reward: [(0, '422.455')]
+[2023-03-09 14:53:26,104][744402] Updated weights for policy 0, policy_version 24000 (0.0005)
+[2023-03-09 14:53:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 12312576. Throughput: 0: 9074.7. Samples: 12304396. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:28,995][744089] Avg episode reward: [(0, '425.992')]
+[2023-03-09 14:53:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000024048_12312576.pth...
+[2023-03-09 14:53:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000023512_12038144.pth
+[2023-03-09 14:53:30,515][744402] Updated weights for policy 0, policy_version 24080 (0.0005)
+[2023-03-09 14:53:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 12361728. Throughput: 0: 9103.2. Samples: 12361696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:33,995][744089] Avg episode reward: [(0, '429.057')]
+[2023-03-09 14:53:34,656][744402] Updated weights for policy 0, policy_version 24160 (0.0005)
+[2023-03-09 14:53:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 12406784. Throughput: 0: 9102.5. Samples: 12388804. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:38,995][744089] Avg episode reward: [(0, '445.315')]
+[2023-03-09 14:53:39,298][744402] Updated weights for policy 0, policy_version 24240 (0.0004)
+[2023-03-09 14:53:43,601][744402] Updated weights for policy 0, policy_version 24320 (0.0005)
+[2023-03-09 14:53:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 12451840. Throughput: 0: 9187.7. Samples: 12444992. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:43,995][744089] Avg episode reward: [(0, '342.455')]
+[2023-03-09 14:53:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000024320_12451840.pth...
+[2023-03-09 14:53:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000023776_12173312.pth
+[2023-03-09 14:53:48,031][744402] Updated weights for policy 0, policy_version 24400 (0.0004)
+[2023-03-09 14:53:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 12500992. Throughput: 0: 9206.4. Samples: 12500984. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:48,996][744089] Avg episode reward: [(0, '423.301')]
+[2023-03-09 14:53:52,047][744402] Updated weights for policy 0, policy_version 24480 (0.0005)
+[2023-03-09 14:53:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 12550144. Throughput: 0: 9325.6. Samples: 12532332. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:53,996][744089] Avg episode reward: [(0, '414.598')]
+[2023-03-09 14:53:56,239][744402] Updated weights for policy 0, policy_version 24560 (0.0005)
+[2023-03-09 14:53:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9352.5, 300 sec: 9150.0). Total num frames: 12599296. Throughput: 0: 9431.2. Samples: 12590176. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:53:58,995][744089] Avg episode reward: [(0, '437.411')]
+[2023-03-09 14:53:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000024608_12599296.pth...
+[2023-03-09 14:53:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000024048_12312576.pth
+[2023-03-09 14:54:00,719][744402] Updated weights for policy 0, policy_version 24640 (0.0005)
+[2023-03-09 14:54:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 12640256. Throughput: 0: 9353.7. Samples: 12643052. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:54:03,995][744089] Avg episode reward: [(0, '460.274')]
+[2023-03-09 14:54:05,327][744402] Updated weights for policy 0, policy_version 24720 (0.0004)
+[2023-03-09 14:54:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9150.0). Total num frames: 12689408. Throughput: 0: 9320.9. Samples: 12668992. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:54:08,995][744089] Avg episode reward: [(0, '398.327')]
+[2023-03-09 14:54:09,777][744402] Updated weights for policy 0, policy_version 24800 (0.0004)
+[2023-03-09 14:54:13,970][744402] Updated weights for policy 0, policy_version 24880 (0.0005)
+[2023-03-09 14:54:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9420.8, 300 sec: 9150.0). Total num frames: 12738560. Throughput: 0: 9375.2. Samples: 12726280. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:54:13,996][744089] Avg episode reward: [(0, '395.321')]
+[2023-03-09 14:54:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000024880_12738560.pth...
+[2023-03-09 14:54:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000024320_12451840.pth
+[2023-03-09 14:54:18,553][744402] Updated weights for policy 0, policy_version 24960 (0.0004)
+[2023-03-09 14:54:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 12779520. Throughput: 0: 9345.4. Samples: 12782240. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:54:18,996][744089] Avg episode reward: [(0, '424.138')]
+[2023-03-09 14:54:22,882][744402] Updated weights for policy 0, policy_version 25040 (0.0005)
+[2023-03-09 14:54:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 12828672. Throughput: 0: 9346.0. Samples: 12809376. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:54:23,995][744089] Avg episode reward: [(0, '441.120')]
+[2023-03-09 14:54:27,487][744402] Updated weights for policy 0, policy_version 25120 (0.0005)
+[2023-03-09 14:54:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 12873728. Throughput: 0: 9340.0. Samples: 12865292. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 14:54:28,996][744089] Avg episode reward: [(0, '434.420')]
+[2023-03-09 14:54:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000025144_12873728.pth...
+[2023-03-09 14:54:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000024608_12599296.pth
+[2023-03-09 14:54:31,952][744402] Updated weights for policy 0, policy_version 25200 (0.0005)
+[2023-03-09 14:54:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 12918784. Throughput: 0: 9293.1. Samples: 12919172. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:54:33,995][744089] Avg episode reward: [(0, '281.882')]
+[2023-03-09 14:54:36,281][744402] Updated weights for policy 0, policy_version 25280 (0.0005)
+[2023-03-09 14:54:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 12963840. Throughput: 0: 9231.4. Samples: 12947744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:54:38,995][744089] Avg episode reward: [(0, '413.741')]
+[2023-03-09 14:54:40,955][744402] Updated weights for policy 0, policy_version 25360 (0.0005)
+[2023-03-09 14:54:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9150.0). Total num frames: 13008896. Throughput: 0: 9119.4. Samples: 13000548. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:54:43,995][744089] Avg episode reward: [(0, '429.188')]
+[2023-03-09 14:54:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000025408_13008896.pth...
+[2023-03-09 14:54:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000024880_12738560.pth
+[2023-03-09 14:54:45,622][744402] Updated weights for policy 0, policy_version 25440 (0.0005)
+[2023-03-09 14:54:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 13053952. Throughput: 0: 9138.5. Samples: 13054284. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:54:48,995][744089] Avg episode reward: [(0, '408.721')]
+[2023-03-09 14:54:50,206][744402] Updated weights for policy 0, policy_version 25520 (0.0005)
+[2023-03-09 14:54:53,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 13099008. Throughput: 0: 9151.0. Samples: 13080788. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:54:53,996][744089] Avg episode reward: [(0, '363.945')]
+[2023-03-09 14:54:54,753][744402] Updated weights for policy 0, policy_version 25600 (0.0005)
+[2023-03-09 14:54:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 13144064. Throughput: 0: 9101.6. Samples: 13135852. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:54:58,996][744089] Avg episode reward: [(0, '364.619')]
+[2023-03-09 14:54:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000025672_13144064.pth...
+[2023-03-09 14:54:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000025144_12873728.pth
+[2023-03-09 14:54:59,196][744402] Updated weights for policy 0, policy_version 25680 (0.0005)
+[2023-03-09 14:55:03,869][744402] Updated weights for policy 0, policy_version 25760 (0.0005)
+[2023-03-09 14:55:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 13189120. Throughput: 0: 9040.5. Samples: 13189064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:55:03,996][744089] Avg episode reward: [(0, '351.914')]
+[2023-03-09 14:55:08,369][744402] Updated weights for policy 0, policy_version 25840 (0.0005)
+[2023-03-09 14:55:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 13234176. Throughput: 0: 9066.2. Samples: 13217356. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:55:08,995][744089] Avg episode reward: [(0, '380.414')]
+[2023-03-09 14:55:12,801][744402] Updated weights for policy 0, policy_version 25920 (0.0005)
+[2023-03-09 14:55:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 13279232. Throughput: 0: 9018.1. Samples: 13271104. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:55:13,995][744089] Avg episode reward: [(0, '428.545')]
+[2023-03-09 14:55:13,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000025936_13279232.pth...
+[2023-03-09 14:55:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000025408_13008896.pth
+[2023-03-09 14:55:17,359][744402] Updated weights for policy 0, policy_version 26000 (0.0005)
+[2023-03-09 14:55:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 13324288. Throughput: 0: 9054.6. Samples: 13326628. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:55:18,995][744089] Avg episode reward: [(0, '435.168')]
+[2023-03-09 14:55:19,588][744358] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000003
+[2023-03-09 14:55:21,717][744402] Updated weights for policy 0, policy_version 26080 (0.0005)
+[2023-03-09 14:55:23,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 13373440. Throughput: 0: 9019.0. Samples: 13353600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:55:23,995][744089] Avg episode reward: [(0, '438.885')]
+[2023-03-09 14:55:26,277][744402] Updated weights for policy 0, policy_version 26160 (0.0005)
+[2023-03-09 14:55:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 13418496. Throughput: 0: 9063.1. Samples: 13408388. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:55:29,006][744089] Avg episode reward: [(0, '459.707')]
+[2023-03-09 14:55:29,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000026208_13418496.pth...
+[2023-03-09 14:55:29,011][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000025672_13144064.pth
+[2023-03-09 14:55:30,564][744402] Updated weights for policy 0, policy_version 26240 (0.0005)
+[2023-03-09 14:55:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 13463552. Throughput: 0: 9101.2. Samples: 13463840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:55:33,995][744089] Avg episode reward: [(0, '442.205')]
+[2023-03-09 14:55:35,024][744402] Updated weights for policy 0, policy_version 26320 (0.0005)
+[2023-03-09 14:55:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 13508608. Throughput: 0: 9141.3. Samples: 13492148. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:55:38,996][744089] Avg episode reward: [(0, '277.226')]
+[2023-03-09 14:55:39,643][744402] Updated weights for policy 0, policy_version 26400 (0.0004)
+[2023-03-09 14:55:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 13553664. Throughput: 0: 9102.7. Samples: 13545472. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:55:43,995][744089] Avg episode reward: [(0, '294.741')]
+[2023-03-09 14:55:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000026472_13553664.pth...
+[2023-03-09 14:55:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000025936_13279232.pth
+[2023-03-09 14:55:44,142][744402] Updated weights for policy 0, policy_version 26480 (0.0005)
+[2023-03-09 14:55:48,531][744402] Updated weights for policy 0, policy_version 26560 (0.0004)
+[2023-03-09 14:55:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 13602816. Throughput: 0: 9179.6. Samples: 13602144. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:55:48,995][744089] Avg episode reward: [(0, '388.496')]
+[2023-03-09 14:55:52,909][744402] Updated weights for policy 0, policy_version 26640 (0.0004)
+[2023-03-09 14:55:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 13647872. Throughput: 0: 9134.2. Samples: 13628396. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:55:53,995][744089] Avg episode reward: [(0, '463.379')]
+[2023-03-09 14:55:57,198][744402] Updated weights for policy 0, policy_version 26720 (0.0005)
+[2023-03-09 14:55:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 13697024. Throughput: 0: 9226.6. Samples: 13686304. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:55:58,995][744089] Avg episode reward: [(0, '440.585')]
+[2023-03-09 14:55:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000026752_13697024.pth...
+[2023-03-09 14:55:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000026208_13418496.pth
+[2023-03-09 14:56:01,753][744402] Updated weights for policy 0, policy_version 26800 (0.0005)
+[2023-03-09 14:56:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 13742080. Throughput: 0: 9228.3. Samples: 13741904. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:56:03,995][744089] Avg episode reward: [(0, '432.631')]
+[2023-03-09 14:56:06,080][744402] Updated weights for policy 0, policy_version 26880 (0.0006)
+[2023-03-09 14:56:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 13787136. Throughput: 0: 9257.2. Samples: 13770172. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:56:08,995][744089] Avg episode reward: [(0, '400.964')]
+[2023-03-09 14:56:10,358][744402] Updated weights for policy 0, policy_version 26960 (0.0006)
+[2023-03-09 14:56:13,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9352.5, 300 sec: 9163.9). Total num frames: 13840384. Throughput: 0: 9363.9. Samples: 13829764. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:56:13,996][744089] Avg episode reward: [(0, '444.221')]
+[2023-03-09 14:56:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000027032_13840384.pth...
+[2023-03-09 14:56:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000026472_13553664.pth
+[2023-03-09 14:56:14,301][744402] Updated weights for policy 0, policy_version 27040 (0.0005)
+[2023-03-09 14:56:18,515][744402] Updated weights for policy 0, policy_version 27120 (0.0005)
+[2023-03-09 14:56:18,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9420.8, 300 sec: 9177.8). Total num frames: 13889536. Throughput: 0: 9452.9. Samples: 13889220. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:56:18,996][744089] Avg episode reward: [(0, '456.943')]
+[2023-03-09 14:56:22,688][744402] Updated weights for policy 0, policy_version 27200 (0.0005)
+[2023-03-09 14:56:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9352.5, 300 sec: 9177.8). Total num frames: 13934592. Throughput: 0: 9467.9. Samples: 13918204. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:56:23,995][744089] Avg episode reward: [(0, '429.844')]
+[2023-03-09 14:56:26,973][744402] Updated weights for policy 0, policy_version 27280 (0.0005)
+[2023-03-09 14:56:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9191.7). Total num frames: 13983744. Throughput: 0: 9557.3. Samples: 13975552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:56:28,996][744089] Avg episode reward: [(0, '467.761')]
+[2023-03-09 14:56:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000027312_13983744.pth...
+[2023-03-09 14:56:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000026752_13697024.pth
+[2023-03-09 14:56:31,329][744402] Updated weights for policy 0, policy_version 27360 (0.0005)
+[2023-03-09 14:56:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9191.7). Total num frames: 14032896. Throughput: 0: 9568.9. Samples: 14032744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:56:33,996][744089] Avg episode reward: [(0, '413.071')]
+[2023-03-09 14:56:35,618][744402] Updated weights for policy 0, policy_version 27440 (0.0005)
+[2023-03-09 14:56:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9557.4, 300 sec: 9219.5). Total num frames: 14082048. Throughput: 0: 9617.8. Samples: 14061196. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:56:38,995][744089] Avg episode reward: [(0, '323.447')]
+[2023-03-09 14:56:39,784][744402] Updated weights for policy 0, policy_version 27520 (0.0005)
+[2023-03-09 14:56:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9205.6). Total num frames: 14127104. Throughput: 0: 9608.1. Samples: 14118668. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:56:43,996][744089] Avg episode reward: [(0, '356.126')]
+[2023-03-09 14:56:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000027592_14127104.pth...
+[2023-03-09 14:56:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000027032_13840384.pth
+[2023-03-09 14:56:44,273][744402] Updated weights for policy 0, policy_version 27600 (0.0005)
+[2023-03-09 14:56:48,523][744402] Updated weights for policy 0, policy_version 27680 (0.0005)
+[2023-03-09 14:56:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9219.5). Total num frames: 14176256. Throughput: 0: 9642.1. Samples: 14175800. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:56:48,996][744089] Avg episode reward: [(0, '458.077')]
+[2023-03-09 14:56:52,922][744402] Updated weights for policy 0, policy_version 27760 (0.0005)
+[2023-03-09 14:56:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9205.6). Total num frames: 14221312. Throughput: 0: 9630.1. Samples: 14203528. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:56:53,995][744089] Avg episode reward: [(0, '417.996')]
+[2023-03-09 14:56:57,166][744402] Updated weights for policy 0, policy_version 27840 (0.0005)
+[2023-03-09 14:56:58,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9233.4). Total num frames: 14270464. Throughput: 0: 9574.0. Samples: 14260592. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:56:58,995][744089] Avg episode reward: [(0, '458.923')]
+[2023-03-09 14:56:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000027872_14270464.pth...
+[2023-03-09 14:56:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000027312_13983744.pth
+[2023-03-09 14:57:01,414][744402] Updated weights for policy 0, policy_version 27920 (0.0005)
+[2023-03-09 14:57:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9247.2). Total num frames: 14319616. Throughput: 0: 9549.5. Samples: 14318948. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:57:03,996][744089] Avg episode reward: [(0, '349.274')]
+[2023-03-09 14:57:05,652][744402] Updated weights for policy 0, policy_version 28000 (0.0005)
+[2023-03-09 14:57:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9261.1). Total num frames: 14368768. Throughput: 0: 9559.0. Samples: 14348360. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:57:08,995][744089] Avg episode reward: [(0, '277.982')]
+[2023-03-09 14:57:09,643][744402] Updated weights for policy 0, policy_version 28080 (0.0005)
+[2023-03-09 14:57:13,965][744402] Updated weights for policy 0, policy_version 28160 (0.0006)
+[2023-03-09 14:57:13,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9275.0). Total num frames: 14417920. Throughput: 0: 9596.7. Samples: 14407404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:13,995][744089] Avg episode reward: [(0, '307.002')]
+[2023-03-09 14:57:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000028160_14417920.pth...
+[2023-03-09 14:57:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000027592_14127104.pth
+[2023-03-09 14:57:18,104][744402] Updated weights for policy 0, policy_version 28240 (0.0005)
+[2023-03-09 14:57:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.4, 300 sec: 9275.0). Total num frames: 14462976. Throughput: 0: 9611.4. Samples: 14465256. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:18,995][744089] Avg episode reward: [(0, '340.291')]
+[2023-03-09 14:57:22,228][744402] Updated weights for policy 0, policy_version 28320 (0.0005)
+[2023-03-09 14:57:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9302.8). Total num frames: 14516224. Throughput: 0: 9658.0. Samples: 14495808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:23,995][744089] Avg episode reward: [(0, '401.347')]
+[2023-03-09 14:57:26,443][744402] Updated weights for policy 0, policy_version 28400 (0.0005)
+[2023-03-09 14:57:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9302.8). Total num frames: 14561280. Throughput: 0: 9653.2. Samples: 14553060. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:28,995][744089] Avg episode reward: [(0, '437.304')]
+[2023-03-09 14:57:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000028440_14561280.pth...
+[2023-03-09 14:57:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000027872_14270464.pth
+[2023-03-09 14:57:30,766][744402] Updated weights for policy 0, policy_version 28480 (0.0005)
+[2023-03-09 14:57:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9330.5). Total num frames: 14610432. Throughput: 0: 9660.1. Samples: 14610504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:33,996][744089] Avg episode reward: [(0, '455.587')]
+[2023-03-09 14:57:35,192][744402] Updated weights for policy 0, policy_version 28560 (0.0005)
+[2023-03-09 14:57:38,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9344.4). Total num frames: 14659584. Throughput: 0: 9679.7. Samples: 14639116. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:38,996][744089] Avg episode reward: [(0, '456.767')]
+[2023-03-09 14:57:39,401][744402] Updated weights for policy 0, policy_version 28640 (0.0004)
+[2023-03-09 14:57:43,714][744402] Updated weights for policy 0, policy_version 28720 (0.0005)
+[2023-03-09 14:57:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9330.6). Total num frames: 14704640. Throughput: 0: 9687.1. Samples: 14696512. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:43,995][744089] Avg episode reward: [(0, '460.256')]
+[2023-03-09 14:57:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000028720_14704640.pth...
+[2023-03-09 14:57:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000028160_14417920.pth
+[2023-03-09 14:57:48,286][744402] Updated weights for policy 0, policy_version 28800 (0.0005)
+[2023-03-09 14:57:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9557.3, 300 sec: 9330.5). Total num frames: 14749696. Throughput: 0: 9589.6. Samples: 14750480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:48,996][744089] Avg episode reward: [(0, '453.099')]
+[2023-03-09 14:57:52,658][744402] Updated weights for policy 0, policy_version 28880 (0.0005)
+[2023-03-09 14:57:53,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9557.3, 300 sec: 9344.4). Total num frames: 14794752. Throughput: 0: 9559.9. Samples: 14778556. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:53,995][744089] Avg episode reward: [(0, '404.576')]
+[2023-03-09 14:57:57,220][744402] Updated weights for policy 0, policy_version 28960 (0.0004)
+[2023-03-09 14:57:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9344.4). Total num frames: 14843904. Throughput: 0: 9445.6. Samples: 14832456. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:57:58,995][744089] Avg episode reward: [(0, '436.632')]
+[2023-03-09 14:57:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000028992_14843904.pth...
+[2023-03-09 14:57:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000028440_14561280.pth
+[2023-03-09 14:58:01,639][744402] Updated weights for policy 0, policy_version 29040 (0.0005)
+[2023-03-09 14:58:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9358.3). Total num frames: 14888960. Throughput: 0: 9417.2. Samples: 14889032. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:58:03,995][744089] Avg episode reward: [(0, '434.370')]
+[2023-03-09 14:58:06,026][744402] Updated weights for policy 0, policy_version 29120 (0.0005)
+[2023-03-09 14:58:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 14934016. Throughput: 0: 9361.8. Samples: 14917088. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:58:08,995][744089] Avg episode reward: [(0, '483.216')]
+[2023-03-09 14:58:10,288][744402] Updated weights for policy 0, policy_version 29200 (0.0005)
+[2023-03-09 14:58:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 14983168. Throughput: 0: 9371.3. Samples: 14974768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:58:13,996][744089] Avg episode reward: [(0, '425.382')]
+[2023-03-09 14:58:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000029264_14983168.pth...
+[2023-03-09 14:58:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000028720_14704640.pth
+[2023-03-09 14:58:14,658][744402] Updated weights for policy 0, policy_version 29280 (0.0004)
+[2023-03-09 14:58:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 15028224. Throughput: 0: 9298.8. Samples: 15028948. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:58:18,995][744089] Avg episode reward: [(0, '481.855')]
+[2023-03-09 14:58:19,156][744402] Updated weights for policy 0, policy_version 29360 (0.0005)
+[2023-03-09 14:58:23,518][744402] Updated weights for policy 0, policy_version 29440 (0.0005)
+[2023-03-09 14:58:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9352.5, 300 sec: 9372.2). Total num frames: 15077376. Throughput: 0: 9284.2. Samples: 15056904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:58:23,995][744089] Avg episode reward: [(0, '446.911')]
+[2023-03-09 14:58:27,753][744402] Updated weights for policy 0, policy_version 29520 (0.0005)
+[2023-03-09 14:58:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9358.3). Total num frames: 15122432. Throughput: 0: 9288.1. Samples: 15114476. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:58:28,995][744089] Avg episode reward: [(0, '429.013')]
+[2023-03-09 14:58:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000029536_15122432.pth...
+[2023-03-09 14:58:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000028992_14843904.pth
+[2023-03-09 14:58:32,127][744402] Updated weights for policy 0, policy_version 29600 (0.0005)
+[2023-03-09 14:58:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9352.5, 300 sec: 9372.2). Total num frames: 15171584. Throughput: 0: 9353.7. Samples: 15171396. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:58:33,995][744089] Avg episode reward: [(0, '436.454')]
+[2023-03-09 14:58:36,673][744402] Updated weights for policy 0, policy_version 29680 (0.0005)
+[2023-03-09 14:58:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9372.2). Total num frames: 15216640. Throughput: 0: 9309.7. Samples: 15197492. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:58:38,995][744089] Avg episode reward: [(0, '466.697')]
+[2023-03-09 14:58:40,998][744402] Updated weights for policy 0, policy_version 29760 (0.0004)
+[2023-03-09 14:58:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9358.3). Total num frames: 15261696. Throughput: 0: 9356.5. Samples: 15253500. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 14:58:43,995][744089] Avg episode reward: [(0, '355.764')]
+[2023-03-09 14:58:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000029808_15261696.pth...
+[2023-03-09 14:58:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000029264_14983168.pth
+[2023-03-09 14:58:45,644][744402] Updated weights for policy 0, policy_version 29840 (0.0004)
+[2023-03-09 14:58:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9344.4). Total num frames: 15306752. Throughput: 0: 9292.2. Samples: 15307180. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:58:48,995][744089] Avg episode reward: [(0, '394.346')]
+[2023-03-09 14:58:50,049][744402] Updated weights for policy 0, policy_version 29920 (0.0004)
+[2023-03-09 14:58:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9330.6). Total num frames: 15351808. Throughput: 0: 9296.4. Samples: 15335424. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:58:53,995][744089] Avg episode reward: [(0, '465.114')]
+[2023-03-09 14:58:54,411][744402] Updated weights for policy 0, policy_version 30000 (0.0005)
+[2023-03-09 14:58:58,819][744402] Updated weights for policy 0, policy_version 30080 (0.0005)
+[2023-03-09 14:58:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9358.3). Total num frames: 15400960. Throughput: 0: 9285.1. Samples: 15392596. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:58:58,996][744089] Avg episode reward: [(0, '463.202')]
+[2023-03-09 14:58:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000030080_15400960.pth...
+[2023-03-09 14:58:59,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000029536_15122432.pth
+[2023-03-09 14:59:03,354][744402] Updated weights for policy 0, policy_version 30160 (0.0005)
+[2023-03-09 14:59:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9344.4). Total num frames: 15446016. Throughput: 0: 9268.2. Samples: 15446016. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 14:59:03,995][744089] Avg episode reward: [(0, '482.487')]
+[2023-03-09 14:59:07,882][744402] Updated weights for policy 0, policy_version 30240 (0.0005)
+[2023-03-09 14:59:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9330.6). Total num frames: 15491072. Throughput: 0: 9272.8. Samples: 15474180. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:59:08,995][744089] Avg episode reward: [(0, '482.497')]
+[2023-03-09 14:59:12,423][744402] Updated weights for policy 0, policy_version 30320 (0.0005)
+[2023-03-09 14:59:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9344.4). Total num frames: 15536128. Throughput: 0: 9184.8. Samples: 15527792. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:59:13,996][744089] Avg episode reward: [(0, '445.027')]
+[2023-03-09 14:59:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000030344_15536128.pth...
+[2023-03-09 14:59:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000029808_15261696.pth
+[2023-03-09 14:59:17,004][744402] Updated weights for policy 0, policy_version 30400 (0.0005)
+[2023-03-09 14:59:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9330.5). Total num frames: 15581184. Throughput: 0: 9105.7. Samples: 15581152. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:59:18,996][744089] Avg episode reward: [(0, '492.139')]
+[2023-03-09 14:59:21,538][744402] Updated weights for policy 0, policy_version 30480 (0.0005)
+[2023-03-09 14:59:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9330.6). Total num frames: 15626240. Throughput: 0: 9145.9. Samples: 15609056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 14:59:23,995][744089] Avg episode reward: [(0, '471.780')]
+[2023-03-09 14:59:25,943][744402] Updated weights for policy 0, policy_version 30560 (0.0004)
+[2023-03-09 14:59:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9344.4). Total num frames: 15675392. Throughput: 0: 9167.4. Samples: 15666032. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:59:28,996][744089] Avg episode reward: [(0, '484.134')]
+[2023-03-09 14:59:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000030616_15675392.pth...
+[2023-03-09 14:59:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000030080_15400960.pth
+[2023-03-09 14:59:30,362][744402] Updated weights for policy 0, policy_version 30640 (0.0005)
+[2023-03-09 14:59:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9344.4). Total num frames: 15720448. Throughput: 0: 9181.6. Samples: 15720352. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:59:33,996][744089] Avg episode reward: [(0, '418.624')]
+[2023-03-09 14:59:34,816][744402] Updated weights for policy 0, policy_version 30720 (0.0005)
+[2023-03-09 14:59:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9344.4). Total num frames: 15765504. Throughput: 0: 9161.1. Samples: 15747676. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:59:38,996][744089] Avg episode reward: [(0, '407.371')]
+[2023-03-09 14:59:39,212][744402] Updated weights for policy 0, policy_version 30800 (0.0005)
+[2023-03-09 14:59:43,453][744402] Updated weights for policy 0, policy_version 30880 (0.0005)
+[2023-03-09 14:59:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9358.3). Total num frames: 15814656. Throughput: 0: 9176.6. Samples: 15805540. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 14:59:43,995][744089] Avg episode reward: [(0, '439.587')]
+[2023-03-09 14:59:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000030888_15814656.pth...
+[2023-03-09 14:59:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000030344_15536128.pth
+[2023-03-09 14:59:47,979][744402] Updated weights for policy 0, policy_version 30960 (0.0005)
+[2023-03-09 14:59:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9358.3). Total num frames: 15859712. Throughput: 0: 9193.2. Samples: 15859712. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:59:48,996][744089] Avg episode reward: [(0, '421.351')]
+[2023-03-09 14:59:52,435][744402] Updated weights for policy 0, policy_version 31040 (0.0005)
+[2023-03-09 14:59:53,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9358.3). Total num frames: 15904768. Throughput: 0: 9184.3. Samples: 15887476. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:59:53,995][744089] Avg episode reward: [(0, '454.361')]
+[2023-03-09 14:59:56,996][744402] Updated weights for policy 0, policy_version 31120 (0.0005)
+[2023-03-09 14:59:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9358.3). Total num frames: 15949824. Throughput: 0: 9183.1. Samples: 15941032. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 14:59:58,996][744089] Avg episode reward: [(0, '484.708')]
+[2023-03-09 14:59:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000031152_15949824.pth...
+[2023-03-09 14:59:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000030616_15675392.pth
+[2023-03-09 15:00:01,237][744402] Updated weights for policy 0, policy_version 31200 (0.0004)
+[2023-03-09 15:00:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9372.2). Total num frames: 15998976. Throughput: 0: 9266.8. Samples: 15998156. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:00:03,995][744089] Avg episode reward: [(0, '468.039')]
+[2023-03-09 15:00:05,659][744402] Updated weights for policy 0, policy_version 31280 (0.0005)
+[2023-03-09 15:00:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9284.3, 300 sec: 9386.1). Total num frames: 16048128. Throughput: 0: 9269.5. Samples: 16026184. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:00:08,995][744089] Avg episode reward: [(0, '491.744')]
+[2023-03-09 15:00:09,706][744402] Updated weights for policy 0, policy_version 31360 (0.0005)
+[2023-03-09 15:00:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9386.1). Total num frames: 16093184. Throughput: 0: 9317.4. Samples: 16085312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:00:13,995][744089] Avg episode reward: [(0, '383.146')]
+[2023-03-09 15:00:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000031432_16093184.pth...
+[2023-03-09 15:00:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000030888_15814656.pth
+[2023-03-09 15:00:14,105][744402] Updated weights for policy 0, policy_version 31440 (0.0005)
+[2023-03-09 15:00:18,730][744402] Updated weights for policy 0, policy_version 31520 (0.0004)
+[2023-03-09 15:00:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9372.2). Total num frames: 16138240. Throughput: 0: 9295.7. Samples: 16138660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:00:18,996][744089] Avg episode reward: [(0, '371.457')]
+[2023-03-09 15:00:23,346][744402] Updated weights for policy 0, policy_version 31600 (0.0005)
+[2023-03-09 15:00:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9372.2). Total num frames: 16183296. Throughput: 0: 9312.7. Samples: 16166748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:00:23,995][744089] Avg episode reward: [(0, '297.061')]
+[2023-03-09 15:00:27,798][744402] Updated weights for policy 0, policy_version 31680 (0.0005)
+[2023-03-09 15:00:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9372.2). Total num frames: 16228352. Throughput: 0: 9215.2. Samples: 16220224. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:00:28,995][744089] Avg episode reward: [(0, '259.536')]
+[2023-03-09 15:00:29,019][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000031704_16232448.pth...
+[2023-03-09 15:00:29,021][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000031152_15949824.pth
+[2023-03-09 15:00:32,179][744402] Updated weights for policy 0, policy_version 31760 (0.0005)
+[2023-03-09 15:00:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9386.1). Total num frames: 16277504. Throughput: 0: 9272.5. Samples: 16276976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:00:33,995][744089] Avg episode reward: [(0, '282.980')]
+[2023-03-09 15:00:36,479][744402] Updated weights for policy 0, policy_version 31840 (0.0006)
+[2023-03-09 15:00:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9386.1). Total num frames: 16322560. Throughput: 0: 9298.6. Samples: 16305912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:00:38,995][744089] Avg episode reward: [(0, '306.831')]
+[2023-03-09 15:00:40,857][744402] Updated weights for policy 0, policy_version 31920 (0.0004)
+[2023-03-09 15:00:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.2, 300 sec: 9386.1). Total num frames: 16371712. Throughput: 0: 9314.5. Samples: 16360184. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:00:43,996][744089] Avg episode reward: [(0, '287.203')]
+[2023-03-09 15:00:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000031976_16371712.pth...
+[2023-03-09 15:00:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000031432_16093184.pth
+[2023-03-09 15:00:45,082][744402] Updated weights for policy 0, policy_version 32000 (0.0005)
+[2023-03-09 15:00:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9386.1). Total num frames: 16416768. Throughput: 0: 9353.9. Samples: 16419080. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:00:48,996][744089] Avg episode reward: [(0, '294.453')]
+[2023-03-09 15:00:49,485][744402] Updated weights for policy 0, policy_version 32080 (0.0005)
+[2023-03-09 15:00:53,838][744402] Updated weights for policy 0, policy_version 32160 (0.0005)
+[2023-03-09 15:00:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9352.5, 300 sec: 9386.1). Total num frames: 16465920. Throughput: 0: 9352.2. Samples: 16447032. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:00:53,995][744089] Avg episode reward: [(0, '197.563')]
+[2023-03-09 15:00:58,253][744402] Updated weights for policy 0, policy_version 32240 (0.0005)
+[2023-03-09 15:00:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9386.1). Total num frames: 16510976. Throughput: 0: 9278.9. Samples: 16502864. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:00:58,996][744089] Avg episode reward: [(0, '250.796')]
+[2023-03-09 15:00:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000032248_16510976.pth...
+[2023-03-09 15:00:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000031704_16232448.pth
+[2023-03-09 15:01:02,569][744402] Updated weights for policy 0, policy_version 32320 (0.0005)
+[2023-03-09 15:01:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9352.6, 300 sec: 9400.0). Total num frames: 16560128. Throughput: 0: 9356.2. Samples: 16559688. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:01:03,995][744089] Avg episode reward: [(0, '319.986')]
+[2023-03-09 15:01:07,000][744402] Updated weights for policy 0, policy_version 32400 (0.0005)
+[2023-03-09 15:01:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9372.2). Total num frames: 16605184. Throughput: 0: 9348.5. Samples: 16587432. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:01:08,996][744089] Avg episode reward: [(0, '396.971')]
+[2023-03-09 15:01:11,468][744402] Updated weights for policy 0, policy_version 32480 (0.0004)
+[2023-03-09 15:01:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9352.5, 300 sec: 9372.2). Total num frames: 16654336. Throughput: 0: 9439.7. Samples: 16645012. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:01:13,995][744089] Avg episode reward: [(0, '375.026')]
+[2023-03-09 15:01:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000032528_16654336.pth...
+[2023-03-09 15:01:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000031976_16371712.pth
+[2023-03-09 15:01:15,566][744402] Updated weights for policy 0, policy_version 32560 (0.0005)
+[2023-03-09 15:01:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9372.2). Total num frames: 16699392. Throughput: 0: 9403.8. Samples: 16700148. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:01:18,995][744089] Avg episode reward: [(0, '358.889')]
+[2023-03-09 15:01:20,045][744402] Updated weights for policy 0, policy_version 32640 (0.0005)
+[2023-03-09 15:01:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9358.3). Total num frames: 16744448. Throughput: 0: 9381.1. Samples: 16728060. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:01:23,995][744089] Avg episode reward: [(0, '325.367')]
+[2023-03-09 15:01:24,586][744402] Updated weights for policy 0, policy_version 32720 (0.0005)
+[2023-03-09 15:01:28,979][744402] Updated weights for policy 0, policy_version 32800 (0.0005)
+[2023-03-09 15:01:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 16793600. Throughput: 0: 9376.0. Samples: 16782104. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:01:28,996][744089] Avg episode reward: [(0, '330.990')]
+[2023-03-09 15:01:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000032800_16793600.pth...
+[2023-03-09 15:01:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000032248_16510976.pth
+[2023-03-09 15:01:33,047][744402] Updated weights for policy 0, policy_version 32880 (0.0005)
+[2023-03-09 15:01:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 16842752. Throughput: 0: 9414.0. Samples: 16842708. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:01:33,995][744089] Avg episode reward: [(0, '315.143')]
+[2023-03-09 15:01:37,637][744402] Updated weights for policy 0, policy_version 32960 (0.0005)
+[2023-03-09 15:01:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 16887808. Throughput: 0: 9351.6. Samples: 16867856. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:01:38,996][744089] Avg episode reward: [(0, '299.879')]
+[2023-03-09 15:01:42,118][744402] Updated weights for policy 0, policy_version 33040 (0.0005)
+[2023-03-09 15:01:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.6, 300 sec: 9344.4). Total num frames: 16932864. Throughput: 0: 9344.7. Samples: 16923376. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:01:43,995][744089] Avg episode reward: [(0, '314.399')]
+[2023-03-09 15:01:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000033072_16932864.pth...
+[2023-03-09 15:01:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000032528_16654336.pth
+[2023-03-09 15:01:46,334][744402] Updated weights for policy 0, policy_version 33120 (0.0005)
+[2023-03-09 15:01:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 16982016. Throughput: 0: 9377.1. Samples: 16981656. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:01:48,995][744089] Avg episode reward: [(0, '354.127')]
+[2023-03-09 15:01:50,664][744402] Updated weights for policy 0, policy_version 33200 (0.0005)
+[2023-03-09 15:01:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9344.4). Total num frames: 17027072. Throughput: 0: 9367.9. Samples: 17008988. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:01:53,995][744089] Avg episode reward: [(0, '373.622')]
+[2023-03-09 15:01:55,339][744402] Updated weights for policy 0, policy_version 33280 (0.0005)
+[2023-03-09 15:01:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9352.5, 300 sec: 9330.6). Total num frames: 17072128. Throughput: 0: 9235.9. Samples: 17060628. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:01:58,996][744089] Avg episode reward: [(0, '329.660')]
+[2023-03-09 15:01:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000033344_17072128.pth...
+[2023-03-09 15:01:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000032800_16793600.pth
+[2023-03-09 15:01:59,729][744402] Updated weights for policy 0, policy_version 33360 (0.0005)
+[2023-03-09 15:02:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.2, 300 sec: 9316.7). Total num frames: 17117184. Throughput: 0: 9267.9. Samples: 17117204. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:02:03,996][744089] Avg episode reward: [(0, '336.114')]
+[2023-03-09 15:02:04,282][744402] Updated weights for policy 0, policy_version 33440 (0.0005)
+[2023-03-09 15:02:08,698][744402] Updated weights for policy 0, policy_version 33520 (0.0004)
+[2023-03-09 15:02:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9302.8). Total num frames: 17162240. Throughput: 0: 9279.0. Samples: 17145616. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:02:08,995][744089] Avg episode reward: [(0, '408.798')]
+[2023-03-09 15:02:13,200][744402] Updated weights for policy 0, policy_version 33600 (0.0005)
+[2023-03-09 15:02:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9302.8). Total num frames: 17207296. Throughput: 0: 9276.4. Samples: 17199540. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:02:13,995][744089] Avg episode reward: [(0, '338.239')]
+[2023-03-09 15:02:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000033608_17207296.pth...
+[2023-03-09 15:02:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000033072_16932864.pth
+[2023-03-09 15:02:17,949][744402] Updated weights for policy 0, policy_version 33680 (0.0005)
+[2023-03-09 15:02:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9275.0). Total num frames: 17252352. Throughput: 0: 9104.6. Samples: 17252416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:02:18,995][744089] Avg episode reward: [(0, '341.788')]
+[2023-03-09 15:02:22,386][744402] Updated weights for policy 0, policy_version 33760 (0.0005)
+[2023-03-09 15:02:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9275.0). Total num frames: 17297408. Throughput: 0: 9173.3. Samples: 17280656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:02:23,995][744089] Avg episode reward: [(0, '323.760')]
+[2023-03-09 15:02:26,668][744402] Updated weights for policy 0, policy_version 33840 (0.0005)
+[2023-03-09 15:02:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9275.0). Total num frames: 17346560. Throughput: 0: 9221.7. Samples: 17338352. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:02:28,996][744089] Avg episode reward: [(0, '389.247')]
+[2023-03-09 15:02:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000033880_17346560.pth...
+[2023-03-09 15:02:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000033344_17072128.pth
+[2023-03-09 15:02:31,019][744402] Updated weights for policy 0, policy_version 33920 (0.0004)
+[2023-03-09 15:02:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9261.1). Total num frames: 17391616. Throughput: 0: 9129.9. Samples: 17392500. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:02:33,996][744089] Avg episode reward: [(0, '350.928')]
+[2023-03-09 15:02:35,540][744402] Updated weights for policy 0, policy_version 34000 (0.0005)
+[2023-03-09 15:02:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.8, 300 sec: 9261.1). Total num frames: 17436672. Throughput: 0: 9138.8. Samples: 17420232. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:02:38,995][744089] Avg episode reward: [(0, '373.917')]
+[2023-03-09 15:02:40,092][744402] Updated weights for policy 0, policy_version 34080 (0.0005)
+[2023-03-09 15:02:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9261.1). Total num frames: 17481728. Throughput: 0: 9175.7. Samples: 17473536. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:02:43,996][744089] Avg episode reward: [(0, '405.828')]
+[2023-03-09 15:02:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000034144_17481728.pth...
+[2023-03-09 15:02:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000033608_17207296.pth
+[2023-03-09 15:02:44,712][744402] Updated weights for policy 0, policy_version 34160 (0.0004)
+[2023-03-09 15:02:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9261.1). Total num frames: 17526784. Throughput: 0: 9121.2. Samples: 17527656. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:02:48,995][744089] Avg episode reward: [(0, '422.860')]
+[2023-03-09 15:02:49,215][744402] Updated weights for policy 0, policy_version 34240 (0.0005)
+[2023-03-09 15:02:53,721][744402] Updated weights for policy 0, policy_version 34320 (0.0005)
+[2023-03-09 15:02:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9247.2). Total num frames: 17571840. Throughput: 0: 9103.2. Samples: 17555260. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:02:53,995][744089] Avg episode reward: [(0, '408.953')]
+[2023-03-09 15:02:58,141][744402] Updated weights for policy 0, policy_version 34400 (0.0005)
+[2023-03-09 15:02:58,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.8, 300 sec: 9261.1). Total num frames: 17620992. Throughput: 0: 9115.7. Samples: 17609748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:02:58,995][744089] Avg episode reward: [(0, '417.077')]
+[2023-03-09 15:02:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000034416_17620992.pth...
+[2023-03-09 15:02:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000033880_17346560.pth
+[2023-03-09 15:03:02,572][744402] Updated weights for policy 0, policy_version 34480 (0.0005)
+[2023-03-09 15:03:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9261.1). Total num frames: 17666048. Throughput: 0: 9178.9. Samples: 17665468. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:03,995][744089] Avg episode reward: [(0, '436.098')]
+[2023-03-09 15:03:07,192][744402] Updated weights for policy 0, policy_version 34560 (0.0005)
+[2023-03-09 15:03:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9247.2). Total num frames: 17711104. Throughput: 0: 9121.1. Samples: 17691104. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:08,995][744089] Avg episode reward: [(0, '448.417')]
+[2023-03-09 15:03:11,969][744402] Updated weights for policy 0, policy_version 34640 (0.0004)
+[2023-03-09 15:03:13,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9233.4). Total num frames: 17752064. Throughput: 0: 9013.0. Samples: 17743936. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:13,995][744089] Avg episode reward: [(0, '441.814')]
+[2023-03-09 15:03:13,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000034672_17752064.pth...
+[2023-03-09 15:03:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000034144_17481728.pth
+[2023-03-09 15:03:16,407][744402] Updated weights for policy 0, policy_version 34720 (0.0005)
+[2023-03-09 15:03:18,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9233.4). Total num frames: 17801216. Throughput: 0: 9049.9. Samples: 17799748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:18,996][744089] Avg episode reward: [(0, '447.322')]
+[2023-03-09 15:03:20,916][744402] Updated weights for policy 0, policy_version 34800 (0.0005)
+[2023-03-09 15:03:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9233.4). Total num frames: 17846272. Throughput: 0: 9022.7. Samples: 17826252. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:23,995][744089] Avg episode reward: [(0, '481.882')]
+[2023-03-09 15:03:25,353][744402] Updated weights for policy 0, policy_version 34880 (0.0006)
+[2023-03-09 15:03:28,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9011.2, 300 sec: 9205.6). Total num frames: 17887232. Throughput: 0: 9056.1. Samples: 17881060. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:28,995][744089] Avg episode reward: [(0, '476.296')]
+[2023-03-09 15:03:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000034936_17887232.pth...
+[2023-03-09 15:03:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000034416_17620992.pth
+[2023-03-09 15:03:30,004][744402] Updated weights for policy 0, policy_version 34960 (0.0004)
+[2023-03-09 15:03:33,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9011.2, 300 sec: 9205.6). Total num frames: 17932288. Throughput: 0: 9040.8. Samples: 17934492. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:33,995][744089] Avg episode reward: [(0, '479.270')]
+[2023-03-09 15:03:34,535][744402] Updated weights for policy 0, policy_version 35040 (0.0005)
+[2023-03-09 15:03:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9205.6). Total num frames: 17977344. Throughput: 0: 9002.5. Samples: 17960372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:38,995][744089] Avg episode reward: [(0, '438.736')]
+[2023-03-09 15:03:39,036][744402] Updated weights for policy 0, policy_version 35120 (0.0005)
+[2023-03-09 15:03:43,674][744402] Updated weights for policy 0, policy_version 35200 (0.0005)
+[2023-03-09 15:03:43,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9011.2, 300 sec: 9205.6). Total num frames: 18022400. Throughput: 0: 8989.4. Samples: 18014272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:43,996][744089] Avg episode reward: [(0, '400.027')]
+[2023-03-09 15:03:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000035200_18022400.pth...
+[2023-03-09 15:03:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000034672_17752064.pth
+[2023-03-09 15:03:48,218][744402] Updated weights for policy 0, policy_version 35280 (0.0005)
+[2023-03-09 15:03:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9205.6). Total num frames: 18067456. Throughput: 0: 8953.0. Samples: 18068352. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:48,995][744089] Avg episode reward: [(0, '411.382')]
+[2023-03-09 15:03:52,918][744402] Updated weights for policy 0, policy_version 35360 (0.0005)
+[2023-03-09 15:03:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9191.7). Total num frames: 18112512. Throughput: 0: 8987.4. Samples: 18095536. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:53,995][744089] Avg episode reward: [(0, '491.069')]
+[2023-03-09 15:03:57,512][744402] Updated weights for policy 0, policy_version 35440 (0.0005)
+[2023-03-09 15:03:58,995][744089] Fps is (10 sec: 9011.0, 60 sec: 8942.9, 300 sec: 9191.7). Total num frames: 18157568. Throughput: 0: 8986.7. Samples: 18148340. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:03:58,996][744089] Avg episode reward: [(0, '428.784')]
+[2023-03-09 15:03:59,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000035464_18157568.pth...
+[2023-03-09 15:03:59,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000034936_17887232.pth
+[2023-03-09 15:04:02,277][744402] Updated weights for policy 0, policy_version 35520 (0.0005)
+[2023-03-09 15:04:03,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8874.7, 300 sec: 9177.8). Total num frames: 18198528. Throughput: 0: 8898.1. Samples: 18200164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:03,995][744089] Avg episode reward: [(0, '444.538')]
+[2023-03-09 15:04:06,809][744402] Updated weights for policy 0, policy_version 35600 (0.0005)
+[2023-03-09 15:04:08,995][744089] Fps is (10 sec: 8601.8, 60 sec: 8874.7, 300 sec: 9177.8). Total num frames: 18243584. Throughput: 0: 8911.4. Samples: 18227264. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:08,995][744089] Avg episode reward: [(0, '434.529')]
+[2023-03-09 15:04:11,307][744402] Updated weights for policy 0, policy_version 35680 (0.0004)
+[2023-03-09 15:04:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9177.8). Total num frames: 18288640. Throughput: 0: 8883.4. Samples: 18280812. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:13,995][744089] Avg episode reward: [(0, '349.406')]
+[2023-03-09 15:04:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000035720_18288640.pth...
+[2023-03-09 15:04:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000035200_18022400.pth
+[2023-03-09 15:04:15,946][744402] Updated weights for policy 0, policy_version 35760 (0.0005)
+[2023-03-09 15:04:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8874.7, 300 sec: 9177.8). Total num frames: 18333696. Throughput: 0: 8903.2. Samples: 18335136. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:18,995][744089] Avg episode reward: [(0, '444.439')]
+[2023-03-09 15:04:20,497][744402] Updated weights for policy 0, policy_version 35840 (0.0005)
+[2023-03-09 15:04:23,995][744089] Fps is (10 sec: 9420.7, 60 sec: 8942.9, 300 sec: 9177.8). Total num frames: 18382848. Throughput: 0: 8955.6. Samples: 18363372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:23,996][744089] Avg episode reward: [(0, '373.943')]
+[2023-03-09 15:04:24,796][744402] Updated weights for policy 0, policy_version 35920 (0.0005)
+[2023-03-09 15:04:28,989][744402] Updated weights for policy 0, policy_version 36000 (0.0005)
+[2023-03-09 15:04:28,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 18432000. Throughput: 0: 9022.5. Samples: 18420284. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:28,996][744089] Avg episode reward: [(0, '389.971')]
+[2023-03-09 15:04:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000036000_18432000.pth...
+[2023-03-09 15:04:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000035464_18157568.pth
+[2023-03-09 15:04:33,263][744402] Updated weights for policy 0, policy_version 36080 (0.0005)
+[2023-03-09 15:04:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 18477056. Throughput: 0: 9122.3. Samples: 18478856. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:33,995][744089] Avg episode reward: [(0, '429.769')]
+[2023-03-09 15:04:37,718][744402] Updated weights for policy 0, policy_version 36160 (0.0005)
+[2023-03-09 15:04:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 18522112. Throughput: 0: 9123.3. Samples: 18506084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:38,995][744089] Avg episode reward: [(0, '374.195')]
+[2023-03-09 15:04:42,013][744402] Updated weights for policy 0, policy_version 36240 (0.0005)
+[2023-03-09 15:04:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 18571264. Throughput: 0: 9214.2. Samples: 18562976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:43,996][744089] Avg episode reward: [(0, '475.265')]
+[2023-03-09 15:04:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000036272_18571264.pth...
+[2023-03-09 15:04:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000035720_18288640.pth
+[2023-03-09 15:04:46,470][744402] Updated weights for policy 0, policy_version 36320 (0.0005)
+[2023-03-09 15:04:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 18616320. Throughput: 0: 9251.7. Samples: 18616492. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:04:48,996][744089] Avg episode reward: [(0, '444.567')]
+[2023-03-09 15:04:50,919][744402] Updated weights for policy 0, policy_version 36400 (0.0005)
+[2023-03-09 15:04:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 18661376. Throughput: 0: 9284.3. Samples: 18645056. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:04:53,995][744089] Avg episode reward: [(0, '462.219')]
+[2023-03-09 15:04:55,376][744402] Updated weights for policy 0, policy_version 36480 (0.0004)
+[2023-03-09 15:04:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.8, 300 sec: 9177.8). Total num frames: 18706432. Throughput: 0: 9306.6. Samples: 18699608. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:04:58,995][744089] Avg episode reward: [(0, '441.627')]
+[2023-03-09 15:04:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000036536_18706432.pth...
+[2023-03-09 15:04:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000036000_18432000.pth
+[2023-03-09 15:04:59,868][744402] Updated weights for policy 0, policy_version 36560 (0.0005)
+[2023-03-09 15:05:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 18751488. Throughput: 0: 9285.3. Samples: 18752976. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:05:03,995][744089] Avg episode reward: [(0, '398.930')]
+[2023-03-09 15:05:04,418][744402] Updated weights for policy 0, policy_version 36640 (0.0005)
+[2023-03-09 15:05:08,799][744402] Updated weights for policy 0, policy_version 36720 (0.0006)
+[2023-03-09 15:05:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 18800640. Throughput: 0: 9323.8. Samples: 18782940. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:05:08,995][744089] Avg episode reward: [(0, '439.668')]
+[2023-03-09 15:05:13,130][744402] Updated weights for policy 0, policy_version 36800 (0.0006)
+[2023-03-09 15:05:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 18845696. Throughput: 0: 9309.2. Samples: 18839196. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:05:13,996][744089] Avg episode reward: [(0, '457.297')]
+[2023-03-09 15:05:14,029][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000036816_18849792.pth...
+[2023-03-09 15:05:14,031][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000036272_18571264.pth
+[2023-03-09 15:05:17,659][744402] Updated weights for policy 0, policy_version 36880 (0.0006)
+[2023-03-09 15:05:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 18890752. Throughput: 0: 9209.9. Samples: 18893300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:18,995][744089] Avg episode reward: [(0, '462.476')]
+[2023-03-09 15:05:22,439][744402] Updated weights for policy 0, policy_version 36960 (0.0005)
+[2023-03-09 15:05:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 18935808. Throughput: 0: 9164.3. Samples: 18918476. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:23,995][744089] Avg episode reward: [(0, '469.141')]
+[2023-03-09 15:05:26,955][744402] Updated weights for policy 0, policy_version 37040 (0.0005)
+[2023-03-09 15:05:28,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 18980864. Throughput: 0: 9102.1. Samples: 18972572. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:28,996][744089] Avg episode reward: [(0, '456.117')]
+[2023-03-09 15:05:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000037072_18980864.pth...
+[2023-03-09 15:05:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000036536_18706432.pth
+[2023-03-09 15:05:31,537][744402] Updated weights for policy 0, policy_version 37120 (0.0005)
+[2023-03-09 15:05:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 19025920. Throughput: 0: 9095.8. Samples: 19025804. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:33,996][744089] Avg episode reward: [(0, '388.595')]
+[2023-03-09 15:05:36,134][744402] Updated weights for policy 0, policy_version 37200 (0.0005)
+[2023-03-09 15:05:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9150.1). Total num frames: 19070976. Throughput: 0: 9049.9. Samples: 19052300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:38,995][744089] Avg episode reward: [(0, '415.506')]
+[2023-03-09 15:05:40,549][744402] Updated weights for policy 0, policy_version 37280 (0.0005)
+[2023-03-09 15:05:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 19116032. Throughput: 0: 9063.9. Samples: 19107484. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:43,996][744089] Avg episode reward: [(0, '397.949')]
+[2023-03-09 15:05:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000037336_19116032.pth...
+[2023-03-09 15:05:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000036816_18849792.pth
+[2023-03-09 15:05:45,249][744402] Updated weights for policy 0, policy_version 37360 (0.0004)
+[2023-03-09 15:05:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 19161088. Throughput: 0: 9069.3. Samples: 19161096. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:48,995][744089] Avg episode reward: [(0, '386.792')]
+[2023-03-09 15:05:49,711][744402] Updated weights for policy 0, policy_version 37440 (0.0005)
+[2023-03-09 15:05:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 19206144. Throughput: 0: 9010.8. Samples: 19188428. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:53,995][744089] Avg episode reward: [(0, '470.423')]
+[2023-03-09 15:05:54,115][744402] Updated weights for policy 0, policy_version 37520 (0.0005)
+[2023-03-09 15:05:58,510][744402] Updated weights for policy 0, policy_version 37600 (0.0005)
+[2023-03-09 15:05:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 19255296. Throughput: 0: 9006.3. Samples: 19244480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:05:58,996][744089] Avg episode reward: [(0, '452.512')]
+[2023-03-09 15:05:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000037608_19255296.pth...
+[2023-03-09 15:05:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000037072_18980864.pth
+[2023-03-09 15:06:02,686][744402] Updated weights for policy 0, policy_version 37680 (0.0005)
+[2023-03-09 15:06:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 19304448. Throughput: 0: 9117.1. Samples: 19303572. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:06:03,995][744089] Avg episode reward: [(0, '446.570')]
+[2023-03-09 15:06:07,092][744402] Updated weights for policy 0, policy_version 37760 (0.0005)
+[2023-03-09 15:06:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 19349504. Throughput: 0: 9170.1. Samples: 19331132. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:06:08,995][744089] Avg episode reward: [(0, '380.633')]
+[2023-03-09 15:06:11,474][744402] Updated weights for policy 0, policy_version 37840 (0.0005)
+[2023-03-09 15:06:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 19394560. Throughput: 0: 9197.1. Samples: 19386440. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:06:13,995][744089] Avg episode reward: [(0, '397.428')]
+[2023-03-09 15:06:14,037][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000037888_19398656.pth...
+[2023-03-09 15:06:14,038][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000037336_19116032.pth
+[2023-03-09 15:06:15,833][744402] Updated weights for policy 0, policy_version 37920 (0.0005)
+[2023-03-09 15:06:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 19443712. Throughput: 0: 9280.8. Samples: 19443440. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:06:18,995][744089] Avg episode reward: [(0, '434.498')]
+[2023-03-09 15:06:20,234][744402] Updated weights for policy 0, policy_version 38000 (0.0005)
+[2023-03-09 15:06:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 19488768. Throughput: 0: 9284.8. Samples: 19470116. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:06:23,995][744089] Avg episode reward: [(0, '429.414')]
+[2023-03-09 15:06:24,765][744402] Updated weights for policy 0, policy_version 38080 (0.0005)
+[2023-03-09 15:06:28,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 19533824. Throughput: 0: 9269.2. Samples: 19524600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:06:28,996][744089] Avg episode reward: [(0, '424.367')]
+[2023-03-09 15:06:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000038152_19533824.pth...
+[2023-03-09 15:06:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000037608_19255296.pth
+[2023-03-09 15:06:29,352][744402] Updated weights for policy 0, policy_version 38160 (0.0005)
+[2023-03-09 15:06:33,836][744402] Updated weights for policy 0, policy_version 38240 (0.0005)
+[2023-03-09 15:06:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 19578880. Throughput: 0: 9284.1. Samples: 19578880. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:06:33,996][744089] Avg episode reward: [(0, '321.279')]
+[2023-03-09 15:06:38,249][744402] Updated weights for policy 0, policy_version 38320 (0.0005)
+[2023-03-09 15:06:38,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 19623936. Throughput: 0: 9312.7. Samples: 19607500. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:06:38,995][744089] Avg episode reward: [(0, '146.688')]
+[2023-03-09 15:06:42,758][744402] Updated weights for policy 0, policy_version 38400 (0.0004)
+[2023-03-09 15:06:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 19668992. Throughput: 0: 9255.3. Samples: 19660968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:06:43,995][744089] Avg episode reward: [(0, '178.725')]
+[2023-03-09 15:06:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000038416_19668992.pth...
+[2023-03-09 15:06:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000037888_19398656.pth
+[2023-03-09 15:06:47,505][744402] Updated weights for policy 0, policy_version 38480 (0.0005)
+[2023-03-09 15:06:48,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 19714048. Throughput: 0: 9123.1. Samples: 19714112. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:06:48,995][744089] Avg episode reward: [(0, '361.914')]
+[2023-03-09 15:06:52,017][744402] Updated weights for policy 0, policy_version 38560 (0.0005)
+[2023-03-09 15:06:53,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 19759104. Throughput: 0: 9121.8. Samples: 19741612. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:06:53,995][744089] Avg episode reward: [(0, '349.052')]
+[2023-03-09 15:06:56,506][744402] Updated weights for policy 0, policy_version 38640 (0.0005)
+[2023-03-09 15:06:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 19804160. Throughput: 0: 9100.8. Samples: 19795976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:06:58,996][744089] Avg episode reward: [(0, '449.116')]
+[2023-03-09 15:06:59,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000038680_19804160.pth...
+[2023-03-09 15:06:59,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000038152_19533824.pth
+[2023-03-09 15:07:00,906][744402] Updated weights for policy 0, policy_version 38720 (0.0005)
+[2023-03-09 15:07:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 19849216. Throughput: 0: 9066.7. Samples: 19851444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:07:03,995][744089] Avg episode reward: [(0, '451.229')]
+[2023-03-09 15:07:05,212][744402] Updated weights for policy 0, policy_version 38800 (0.0005)
+[2023-03-09 15:07:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 19898368. Throughput: 0: 9154.0. Samples: 19882048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:07:08,995][744089] Avg episode reward: [(0, '459.708')]
+[2023-03-09 15:07:09,472][744402] Updated weights for policy 0, policy_version 38880 (0.0005)
+[2023-03-09 15:07:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.8, 300 sec: 9122.3). Total num frames: 19943424. Throughput: 0: 9141.2. Samples: 19935952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:07:13,995][744089] Avg episode reward: [(0, '500.898')]
+[2023-03-09 15:07:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000038952_19943424.pth...
+[2023-03-09 15:07:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000038416_19668992.pth
+[2023-03-09 15:07:14,000][744358] Saving new best policy, reward=500.898!
+[2023-03-09 15:07:14,138][744402] Updated weights for policy 0, policy_version 38960 (0.0006)
+[2023-03-09 15:07:18,675][744402] Updated weights for policy 0, policy_version 39040 (0.0005)
+[2023-03-09 15:07:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 19988480. Throughput: 0: 9129.0. Samples: 19989684. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:07:18,995][744089] Avg episode reward: [(0, '499.289')]
+[2023-03-09 15:07:23,105][744402] Updated weights for policy 0, policy_version 39120 (0.0005)
+[2023-03-09 15:07:23,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 20037632. Throughput: 0: 9109.8. Samples: 20017444. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:07:23,996][744089] Avg episode reward: [(0, '426.476')]
+[2023-03-09 15:07:27,595][744402] Updated weights for policy 0, policy_version 39200 (0.0005)
+[2023-03-09 15:07:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 20078592. Throughput: 0: 9144.2. Samples: 20072456. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:07:28,995][744089] Avg episode reward: [(0, '292.505')]
+[2023-03-09 15:07:29,029][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000039224_20082688.pth...
+[2023-03-09 15:07:29,031][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000038680_19804160.pth
+[2023-03-09 15:07:32,229][744402] Updated weights for policy 0, policy_version 39280 (0.0004)
+[2023-03-09 15:07:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 20127744. Throughput: 0: 9188.1. Samples: 20127576. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:07:33,996][744089] Avg episode reward: [(0, '38.815')]
+[2023-03-09 15:07:36,722][744402] Updated weights for policy 0, policy_version 39360 (0.0005)
+[2023-03-09 15:07:38,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 20172800. Throughput: 0: 9139.8. Samples: 20152904. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:07:38,995][744089] Avg episode reward: [(0, '401.007')]
+[2023-03-09 15:07:41,232][744402] Updated weights for policy 0, policy_version 39440 (0.0004)
+[2023-03-09 15:07:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 20217856. Throughput: 0: 9181.9. Samples: 20209160. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:07:43,995][744089] Avg episode reward: [(0, '478.977')]
+[2023-03-09 15:07:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000039488_20217856.pth...
+[2023-03-09 15:07:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000038952_19943424.pth
+[2023-03-09 15:07:45,662][744402] Updated weights for policy 0, policy_version 39520 (0.0005)
+[2023-03-09 15:07:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 20262912. Throughput: 0: 9151.6. Samples: 20263268. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:07:48,995][744089] Avg episode reward: [(0, '480.379')]
+[2023-03-09 15:07:50,036][744402] Updated weights for policy 0, policy_version 39600 (0.0004)
+[2023-03-09 15:07:53,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 20312064. Throughput: 0: 9102.4. Samples: 20291656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:07:53,996][744089] Avg episode reward: [(0, '481.059')]
+[2023-03-09 15:07:54,311][744402] Updated weights for policy 0, policy_version 39680 (0.0005)
+[2023-03-09 15:07:58,652][744402] Updated weights for policy 0, policy_version 39760 (0.0005)
+[2023-03-09 15:07:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 20357120. Throughput: 0: 9195.8. Samples: 20349764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:07:58,996][744089] Avg episode reward: [(0, '492.031')]
+[2023-03-09 15:07:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000039760_20357120.pth...
+[2023-03-09 15:07:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000039224_20082688.pth
+[2023-03-09 15:08:03,346][744402] Updated weights for policy 0, policy_version 39840 (0.0005)
+[2023-03-09 15:08:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 20402176. Throughput: 0: 9180.2. Samples: 20402792. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:03,995][744089] Avg episode reward: [(0, '488.525')]
+[2023-03-09 15:08:07,623][744402] Updated weights for policy 0, policy_version 39920 (0.0005)
+[2023-03-09 15:08:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 20451328. Throughput: 0: 9188.2. Samples: 20430912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:08,995][744089] Avg episode reward: [(0, '477.184')]
+[2023-03-09 15:08:12,019][744402] Updated weights for policy 0, policy_version 40000 (0.0005)
+[2023-03-09 15:08:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 20496384. Throughput: 0: 9226.1. Samples: 20487632. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:13,996][744089] Avg episode reward: [(0, '436.770')]
+[2023-03-09 15:08:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000040032_20496384.pth...
+[2023-03-09 15:08:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000039488_20217856.pth
+[2023-03-09 15:08:16,554][744402] Updated weights for policy 0, policy_version 40080 (0.0005)
+[2023-03-09 15:08:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 20541440. Throughput: 0: 9254.8. Samples: 20544044. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:18,996][744089] Avg episode reward: [(0, '460.337')]
+[2023-03-09 15:08:20,624][744402] Updated weights for policy 0, policy_version 40160 (0.0005)
+[2023-03-09 15:08:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 20590592. Throughput: 0: 9315.5. Samples: 20572100. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:23,996][744089] Avg episode reward: [(0, '403.232')]
+[2023-03-09 15:08:25,386][744402] Updated weights for policy 0, policy_version 40240 (0.0005)
+[2023-03-09 15:08:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 20631552. Throughput: 0: 9257.8. Samples: 20625760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:28,995][744089] Avg episode reward: [(0, '505.906')]
+[2023-03-09 15:08:29,015][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000040304_20635648.pth...
+[2023-03-09 15:08:29,017][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000039760_20357120.pth
+[2023-03-09 15:08:29,017][744358] Saving new best policy, reward=505.906!
+[2023-03-09 15:08:29,944][744402] Updated weights for policy 0, policy_version 40320 (0.0004)
+[2023-03-09 15:08:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 20680704. Throughput: 0: 9260.1. Samples: 20679972. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:33,995][744089] Avg episode reward: [(0, '501.830')]
+[2023-03-09 15:08:34,396][744402] Updated weights for policy 0, policy_version 40400 (0.0005)
+[2023-03-09 15:08:38,926][744402] Updated weights for policy 0, policy_version 40480 (0.0005)
+[2023-03-09 15:08:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 20725760. Throughput: 0: 9211.0. Samples: 20706152. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:38,996][744089] Avg episode reward: [(0, '436.850')]
+[2023-03-09 15:08:43,552][744402] Updated weights for policy 0, policy_version 40560 (0.0005)
+[2023-03-09 15:08:43,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9147.7, 300 sec: 9150.1). Total num frames: 20766720. Throughput: 0: 9117.8. Samples: 20760064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:43,995][744089] Avg episode reward: [(0, '427.385')]
+[2023-03-09 15:08:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000040560_20766720.pth...
+[2023-03-09 15:08:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000040032_20496384.pth
+[2023-03-09 15:08:48,004][744402] Updated weights for policy 0, policy_version 40640 (0.0005)
+[2023-03-09 15:08:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 20815872. Throughput: 0: 9170.4. Samples: 20815460. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:48,995][744089] Avg episode reward: [(0, '494.182')]
+[2023-03-09 15:08:52,643][744402] Updated weights for policy 0, policy_version 40720 (0.0004)
+[2023-03-09 15:08:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9150.1). Total num frames: 20856832. Throughput: 0: 9117.0. Samples: 20841176. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:53,995][744089] Avg episode reward: [(0, '481.613')]
+[2023-03-09 15:08:57,424][744402] Updated weights for policy 0, policy_version 40800 (0.0005)
+[2023-03-09 15:08:58,995][744089] Fps is (10 sec: 8601.5, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 20901888. Throughput: 0: 9021.2. Samples: 20893584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:08:58,996][744089] Avg episode reward: [(0, '478.017')]
+[2023-03-09 15:08:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000040824_20901888.pth...
+[2023-03-09 15:08:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000040304_20635648.pth
+[2023-03-09 15:09:01,985][744402] Updated weights for policy 0, policy_version 40880 (0.0005)
+[2023-03-09 15:09:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 20946944. Throughput: 0: 8971.6. Samples: 20947764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:03,995][744089] Avg episode reward: [(0, '476.622')]
+[2023-03-09 15:09:06,354][744402] Updated weights for policy 0, policy_version 40960 (0.0005)
+[2023-03-09 15:09:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 20996096. Throughput: 0: 8968.6. Samples: 20975688. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:08,996][744089] Avg episode reward: [(0, '471.202')]
+[2023-03-09 15:09:10,736][744402] Updated weights for policy 0, policy_version 41040 (0.0005)
+[2023-03-09 15:09:13,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9079.4, 300 sec: 9177.8). Total num frames: 21041152. Throughput: 0: 9028.6. Samples: 21032048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:13,996][744089] Avg episode reward: [(0, '465.249')]
+[2023-03-09 15:09:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000041096_21041152.pth...
+[2023-03-09 15:09:14,004][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000040560_20766720.pth
+[2023-03-09 15:09:15,374][744402] Updated weights for policy 0, policy_version 41120 (0.0004)
+[2023-03-09 15:09:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 21086208. Throughput: 0: 9026.8. Samples: 21086180. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:18,995][744089] Avg episode reward: [(0, '383.458')]
+[2023-03-09 15:09:19,720][744402] Updated weights for policy 0, policy_version 41200 (0.0005)
+[2023-03-09 15:09:23,995][744089] Fps is (10 sec: 9011.5, 60 sec: 9011.2, 300 sec: 9150.1). Total num frames: 21131264. Throughput: 0: 9104.8. Samples: 21115868. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:23,995][744089] Avg episode reward: [(0, '457.895')]
+[2023-03-09 15:09:24,008][744402] Updated weights for policy 0, policy_version 41280 (0.0005)
+[2023-03-09 15:09:28,483][744402] Updated weights for policy 0, policy_version 41360 (0.0005)
+[2023-03-09 15:09:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 21180416. Throughput: 0: 9108.6. Samples: 21169952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:28,996][744089] Avg episode reward: [(0, '466.836')]
+[2023-03-09 15:09:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000041368_21180416.pth...
+[2023-03-09 15:09:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000040824_20901888.pth
+[2023-03-09 15:09:32,825][744402] Updated weights for policy 0, policy_version 41440 (0.0005)
+[2023-03-09 15:09:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 21225472. Throughput: 0: 9135.1. Samples: 21226540. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:33,995][744089] Avg episode reward: [(0, '485.878')]
+[2023-03-09 15:09:37,039][744402] Updated weights for policy 0, policy_version 41520 (0.0005)
+[2023-03-09 15:09:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 21274624. Throughput: 0: 9225.6. Samples: 21256328. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:38,995][744089] Avg episode reward: [(0, '444.727')]
+[2023-03-09 15:09:41,844][744402] Updated weights for policy 0, policy_version 41600 (0.0004)
+[2023-03-09 15:09:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9150.1). Total num frames: 21315584. Throughput: 0: 9220.4. Samples: 21308500. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:43,996][744089] Avg episode reward: [(0, '356.497')]
+[2023-03-09 15:09:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000041632_21315584.pth...
+[2023-03-09 15:09:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000041096_21041152.pth
+[2023-03-09 15:09:46,353][744402] Updated weights for policy 0, policy_version 41680 (0.0005)
+[2023-03-09 15:09:48,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 21360640. Throughput: 0: 9176.6. Samples: 21360712. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:48,995][744089] Avg episode reward: [(0, '399.271')]
+[2023-03-09 15:09:51,141][744402] Updated weights for policy 0, policy_version 41760 (0.0005)
+[2023-03-09 15:09:53,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9150.0). Total num frames: 21405696. Throughput: 0: 9148.8. Samples: 21387384. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:53,996][744089] Avg episode reward: [(0, '420.355')]
+[2023-03-09 15:09:55,420][744402] Updated weights for policy 0, policy_version 41840 (0.0005)
+[2023-03-09 15:09:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9150.0). Total num frames: 21450752. Throughput: 0: 9132.5. Samples: 21443008. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:09:58,995][744089] Avg episode reward: [(0, '449.765')]
+[2023-03-09 15:09:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000041896_21450752.pth...
+[2023-03-09 15:09:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000041368_21180416.pth
+[2023-03-09 15:10:00,043][744402] Updated weights for policy 0, policy_version 41920 (0.0004)
+[2023-03-09 15:10:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 21495808. Throughput: 0: 9134.0. Samples: 21497212. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:03,996][744089] Avg episode reward: [(0, '426.405')]
+[2023-03-09 15:10:04,507][744402] Updated weights for policy 0, policy_version 42000 (0.0005)
+[2023-03-09 15:10:08,774][744402] Updated weights for policy 0, policy_version 42080 (0.0005)
+[2023-03-09 15:10:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9150.0). Total num frames: 21544960. Throughput: 0: 9153.9. Samples: 21527796. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:08,995][744089] Avg episode reward: [(0, '415.941')]
+[2023-03-09 15:10:13,234][744402] Updated weights for policy 0, policy_version 42160 (0.0005)
+[2023-03-09 15:10:13,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.8, 300 sec: 9150.0). Total num frames: 21590016. Throughput: 0: 9156.5. Samples: 21581992. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:13,995][744089] Avg episode reward: [(0, '366.186')]
+[2023-03-09 15:10:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000042168_21590016.pth...
+[2023-03-09 15:10:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000041632_21315584.pth
+[2023-03-09 15:10:17,716][744402] Updated weights for policy 0, policy_version 42240 (0.0004)
+[2023-03-09 15:10:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 21639168. Throughput: 0: 9158.7. Samples: 21638680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:18,995][744089] Avg episode reward: [(0, '424.889')]
+[2023-03-09 15:10:22,078][744402] Updated weights for policy 0, policy_version 42320 (0.0004)
+[2023-03-09 15:10:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 21684224. Throughput: 0: 9108.6. Samples: 21666216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:23,995][744089] Avg episode reward: [(0, '438.760')]
+[2023-03-09 15:10:26,367][744402] Updated weights for policy 0, policy_version 42400 (0.0005)
+[2023-03-09 15:10:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 21733376. Throughput: 0: 9197.5. Samples: 21722388. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:28,996][744089] Avg episode reward: [(0, '365.466')]
+[2023-03-09 15:10:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000042448_21733376.pth...
+[2023-03-09 15:10:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000041896_21450752.pth
+[2023-03-09 15:10:30,781][744402] Updated weights for policy 0, policy_version 42480 (0.0005)
+[2023-03-09 15:10:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 21778432. Throughput: 0: 9280.7. Samples: 21778344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:33,996][744089] Avg episode reward: [(0, '472.529')]
+[2023-03-09 15:10:35,311][744402] Updated weights for policy 0, policy_version 42560 (0.0006)
+[2023-03-09 15:10:38,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 21819392. Throughput: 0: 9248.7. Samples: 21803576. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:38,995][744089] Avg episode reward: [(0, '485.845')]
+[2023-03-09 15:10:39,849][744402] Updated weights for policy 0, policy_version 42640 (0.0005)
+[2023-03-09 15:10:43,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 21864448. Throughput: 0: 9227.0. Samples: 21858224. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:43,995][744089] Avg episode reward: [(0, '461.922')]
+[2023-03-09 15:10:44,027][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000042712_21868544.pth...
+[2023-03-09 15:10:44,028][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000042168_21590016.pth
+[2023-03-09 15:10:44,418][744402] Updated weights for policy 0, policy_version 42720 (0.0005)
+[2023-03-09 15:10:48,607][744402] Updated weights for policy 0, policy_version 42800 (0.0005)
+[2023-03-09 15:10:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 21913600. Throughput: 0: 9302.2. Samples: 21915808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:48,995][744089] Avg episode reward: [(0, '417.009')]
+[2023-03-09 15:10:52,899][744402] Updated weights for policy 0, policy_version 42880 (0.0006)
+[2023-03-09 15:10:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 21962752. Throughput: 0: 9212.2. Samples: 21942344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:53,995][744089] Avg episode reward: [(0, '375.768')]
+[2023-03-09 15:10:57,100][744402] Updated weights for policy 0, policy_version 42960 (0.0005)
+[2023-03-09 15:10:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9352.5, 300 sec: 9177.8). Total num frames: 22011904. Throughput: 0: 9342.5. Samples: 22002404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:10:58,995][744089] Avg episode reward: [(0, '466.603')]
+[2023-03-09 15:10:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000042992_22011904.pth...
+[2023-03-09 15:10:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000042448_21733376.pth
+[2023-03-09 15:11:01,265][744402] Updated weights for policy 0, policy_version 43040 (0.0005)
+[2023-03-09 15:11:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9191.7). Total num frames: 22061056. Throughput: 0: 9376.4. Samples: 22060620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:11:03,995][744089] Avg episode reward: [(0, '510.996')]
+[2023-03-09 15:11:03,996][744358] Saving new best policy, reward=510.996!
+[2023-03-09 15:11:05,556][744402] Updated weights for policy 0, policy_version 43120 (0.0005)
+[2023-03-09 15:11:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9191.7). Total num frames: 22106112. Throughput: 0: 9404.2. Samples: 22089404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:11:08,995][744089] Avg episode reward: [(0, '484.068')]
+[2023-03-09 15:11:10,100][744402] Updated weights for policy 0, policy_version 43200 (0.0004)
+[2023-03-09 15:11:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9352.5, 300 sec: 9177.8). Total num frames: 22151168. Throughput: 0: 9348.0. Samples: 22143048. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:11:13,995][744089] Avg episode reward: [(0, '503.364')]
+[2023-03-09 15:11:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000043264_22151168.pth...
+[2023-03-09 15:11:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000042712_21868544.pth
+[2023-03-09 15:11:14,601][744402] Updated weights for policy 0, policy_version 43280 (0.0005)
+[2023-03-09 15:11:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 22196224. Throughput: 0: 9344.9. Samples: 22198864. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:11:18,995][744089] Avg episode reward: [(0, '448.643')]
+[2023-03-09 15:11:19,052][744402] Updated weights for policy 0, policy_version 43360 (0.0004)
+[2023-03-09 15:11:23,390][744402] Updated weights for policy 0, policy_version 43440 (0.0005)
+[2023-03-09 15:11:23,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9352.5, 300 sec: 9191.7). Total num frames: 22245376. Throughput: 0: 9451.1. Samples: 22228876. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:11:23,996][744089] Avg episode reward: [(0, '443.992')]
+[2023-03-09 15:11:27,939][744402] Updated weights for policy 0, policy_version 43520 (0.0005)
+[2023-03-09 15:11:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9191.7). Total num frames: 22290432. Throughput: 0: 9408.2. Samples: 22281592. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:11:28,995][744089] Avg episode reward: [(0, '262.261')]
+[2023-03-09 15:11:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000043536_22290432.pth...
+[2023-03-09 15:11:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000042992_22011904.pth
+[2023-03-09 15:11:32,325][744402] Updated weights for policy 0, policy_version 43600 (0.0005)
+[2023-03-09 15:11:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9191.7). Total num frames: 22335488. Throughput: 0: 9388.9. Samples: 22338308. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:11:33,996][744089] Avg episode reward: [(0, '378.269')]
+[2023-03-09 15:11:36,579][744402] Updated weights for policy 0, policy_version 43680 (0.0005)
+[2023-03-09 15:11:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9205.6). Total num frames: 22384640. Throughput: 0: 9424.9. Samples: 22366464. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:11:38,995][744089] Avg episode reward: [(0, '442.189')]
+[2023-03-09 15:11:41,300][744402] Updated weights for policy 0, policy_version 43760 (0.0005)
+[2023-03-09 15:11:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9205.6). Total num frames: 22429696. Throughput: 0: 9273.0. Samples: 22419688. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:11:43,996][744089] Avg episode reward: [(0, '448.348')]
+[2023-03-09 15:11:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000043808_22429696.pth...
+[2023-03-09 15:11:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000043264_22151168.pth
+[2023-03-09 15:11:45,522][744402] Updated weights for policy 0, policy_version 43840 (0.0005)
+[2023-03-09 15:11:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9205.6). Total num frames: 22474752. Throughput: 0: 9217.4. Samples: 22475404. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:11:48,995][744089] Avg episode reward: [(0, '454.541')]
+[2023-03-09 15:11:50,014][744402] Updated weights for policy 0, policy_version 43920 (0.0005)
+[2023-03-09 15:11:53,953][744402] Updated weights for policy 0, policy_version 44000 (0.0005)
+[2023-03-09 15:11:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9233.4). Total num frames: 22528000. Throughput: 0: 9287.1. Samples: 22507324. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:11:53,995][744089] Avg episode reward: [(0, '475.146')]
+[2023-03-09 15:11:58,634][744402] Updated weights for policy 0, policy_version 44080 (0.0005)
+[2023-03-09 15:11:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9219.5). Total num frames: 22568960. Throughput: 0: 9313.3. Samples: 22562148. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:11:58,995][744089] Avg episode reward: [(0, '510.061')]
+[2023-03-09 15:11:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000044080_22568960.pth...
+[2023-03-09 15:11:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000043536_22290432.pth
+[2023-03-09 15:12:03,019][744402] Updated weights for policy 0, policy_version 44160 (0.0005)
+[2023-03-09 15:12:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9219.5). Total num frames: 22618112. Throughput: 0: 9290.0. Samples: 22616916. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:12:03,996][744089] Avg episode reward: [(0, '433.722')]
+[2023-03-09 15:12:07,681][744402] Updated weights for policy 0, policy_version 44240 (0.0005)
+[2023-03-09 15:12:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9219.5). Total num frames: 22663168. Throughput: 0: 9216.4. Samples: 22643612. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:12:08,995][744089] Avg episode reward: [(0, '467.352')]
+[2023-03-09 15:12:12,206][744402] Updated weights for policy 0, policy_version 44320 (0.0005)
+[2023-03-09 15:12:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9219.5). Total num frames: 22708224. Throughput: 0: 9233.2. Samples: 22697084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:13,995][744089] Avg episode reward: [(0, '479.288')]
+[2023-03-09 15:12:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000044352_22708224.pth...
+[2023-03-09 15:12:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000043808_22429696.pth
+[2023-03-09 15:12:16,791][744402] Updated weights for policy 0, policy_version 44400 (0.0005)
+[2023-03-09 15:12:18,995][744089] Fps is (10 sec: 8601.5, 60 sec: 9216.0, 300 sec: 9191.7). Total num frames: 22749184. Throughput: 0: 9186.2. Samples: 22751688. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:18,995][744089] Avg episode reward: [(0, '479.067')]
+[2023-03-09 15:12:21,339][744402] Updated weights for policy 0, policy_version 44480 (0.0005)
+[2023-03-09 15:12:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9219.5). Total num frames: 22798336. Throughput: 0: 9147.8. Samples: 22778116. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:23,995][744089] Avg episode reward: [(0, '478.716')]
+[2023-03-09 15:12:25,738][744402] Updated weights for policy 0, policy_version 44560 (0.0005)
+[2023-03-09 15:12:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 22839296. Throughput: 0: 9163.6. Samples: 22832048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:28,995][744089] Avg episode reward: [(0, '487.393')]
+[2023-03-09 15:12:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000044608_22839296.pth...
+[2023-03-09 15:12:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000044080_22568960.pth
+[2023-03-09 15:12:30,405][744402] Updated weights for policy 0, policy_version 44640 (0.0005)
+[2023-03-09 15:12:33,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 22884352. Throughput: 0: 9139.0. Samples: 22886660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:33,995][744089] Avg episode reward: [(0, '484.933')]
+[2023-03-09 15:12:34,878][744402] Updated weights for policy 0, policy_version 44720 (0.0004)
+[2023-03-09 15:12:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9205.6). Total num frames: 22933504. Throughput: 0: 9039.7. Samples: 22914112. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:38,995][744089] Avg episode reward: [(0, '454.337')]
+[2023-03-09 15:12:39,285][744402] Updated weights for policy 0, policy_version 44800 (0.0004)
+[2023-03-09 15:12:43,885][744402] Updated weights for policy 0, policy_version 44880 (0.0005)
+[2023-03-09 15:12:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9205.6). Total num frames: 22978560. Throughput: 0: 9064.4. Samples: 22970044. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:43,995][744089] Avg episode reward: [(0, '347.546')]
+[2023-03-09 15:12:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000044880_22978560.pth...
+[2023-03-09 15:12:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000044352_22708224.pth
+[2023-03-09 15:12:48,654][744402] Updated weights for policy 0, policy_version 44960 (0.0005)
+[2023-03-09 15:12:48,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 23019520. Throughput: 0: 8984.6. Samples: 23021220. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:48,995][744089] Avg episode reward: [(0, '507.066')]
+[2023-03-09 15:12:53,140][744402] Updated weights for policy 0, policy_version 45040 (0.0005)
+[2023-03-09 15:12:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9191.7). Total num frames: 23068672. Throughput: 0: 9007.5. Samples: 23048948. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:53,995][744089] Avg episode reward: [(0, '495.243')]
+[2023-03-09 15:12:57,420][744402] Updated weights for policy 0, policy_version 45120 (0.0005)
+[2023-03-09 15:12:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 23113728. Throughput: 0: 9076.2. Samples: 23105512. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:12:58,995][744089] Avg episode reward: [(0, '418.293')]
+[2023-03-09 15:12:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000045144_23113728.pth...
+[2023-03-09 15:12:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000044608_22839296.pth
+[2023-03-09 15:13:01,824][744402] Updated weights for policy 0, policy_version 45200 (0.0006)
+[2023-03-09 15:13:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 23162880. Throughput: 0: 9112.4. Samples: 23161744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:13:03,995][744089] Avg episode reward: [(0, '409.543')]
+[2023-03-09 15:13:06,282][744402] Updated weights for policy 0, policy_version 45280 (0.0005)
+[2023-03-09 15:13:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 23203840. Throughput: 0: 9098.1. Samples: 23187528. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:13:08,995][744089] Avg episode reward: [(0, '461.502')]
+[2023-03-09 15:13:10,953][744402] Updated weights for policy 0, policy_version 45360 (0.0005)
+[2023-03-09 15:13:13,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 23248896. Throughput: 0: 9095.5. Samples: 23241344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:13:13,995][744089] Avg episode reward: [(0, '453.241')]
+[2023-03-09 15:13:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000045408_23248896.pth...
+[2023-03-09 15:13:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000044880_22978560.pth
+[2023-03-09 15:13:15,486][744402] Updated weights for policy 0, policy_version 45440 (0.0005)
+[2023-03-09 15:13:18,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 23293952. Throughput: 0: 9050.9. Samples: 23293952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:13:18,996][744089] Avg episode reward: [(0, '486.600')]
+[2023-03-09 15:13:20,204][744402] Updated weights for policy 0, policy_version 45520 (0.0005)
+[2023-03-09 15:13:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 23339008. Throughput: 0: 9017.3. Samples: 23319888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:13:23,995][744089] Avg episode reward: [(0, '476.708')]
+[2023-03-09 15:13:24,712][744402] Updated weights for policy 0, policy_version 45600 (0.0005)
+[2023-03-09 15:13:28,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9011.2, 300 sec: 9150.0). Total num frames: 23379968. Throughput: 0: 8982.0. Samples: 23374236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:13:28,995][744089] Avg episode reward: [(0, '498.406')]
+[2023-03-09 15:13:29,015][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000045672_23384064.pth...
+[2023-03-09 15:13:29,016][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000045144_23113728.pth
+[2023-03-09 15:13:29,475][744402] Updated weights for policy 0, policy_version 45680 (0.0004)
+[2023-03-09 15:13:33,919][744402] Updated weights for policy 0, policy_version 45760 (0.0005)
+[2023-03-09 15:13:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 23429120. Throughput: 0: 9058.0. Samples: 23428832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:13:33,996][744089] Avg episode reward: [(0, '505.391')]
+[2023-03-09 15:13:38,439][744402] Updated weights for policy 0, policy_version 45840 (0.0005)
+[2023-03-09 15:13:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 23474176. Throughput: 0: 9027.2. Samples: 23455172. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:13:38,995][744089] Avg episode reward: [(0, '516.193')]
+[2023-03-09 15:13:38,996][744358] Saving new best policy, reward=516.193!
+[2023-03-09 15:13:42,743][744402] Updated weights for policy 0, policy_version 45920 (0.0005)
+[2023-03-09 15:13:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9163.9). Total num frames: 23519232. Throughput: 0: 9018.1. Samples: 23511324. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:13:43,995][744089] Avg episode reward: [(0, '476.145')]
+[2023-03-09 15:13:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000045936_23519232.pth...
+[2023-03-09 15:13:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000045408_23248896.pth
+[2023-03-09 15:13:47,106][744402] Updated weights for policy 0, policy_version 46000 (0.0005)
+[2023-03-09 15:13:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 23568384. Throughput: 0: 9018.1. Samples: 23567556. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:13:48,995][744089] Avg episode reward: [(0, '466.457')]
+[2023-03-09 15:13:51,372][744402] Updated weights for policy 0, policy_version 46080 (0.0005)
+[2023-03-09 15:13:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 23613440. Throughput: 0: 9100.6. Samples: 23597056. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:13:53,995][744089] Avg episode reward: [(0, '494.788')]
+[2023-03-09 15:13:55,974][744402] Updated weights for policy 0, policy_version 46160 (0.0005)
+[2023-03-09 15:13:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 23658496. Throughput: 0: 9087.9. Samples: 23650300. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:13:58,996][744089] Avg episode reward: [(0, '471.280')]
+[2023-03-09 15:13:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000046208_23658496.pth...
+[2023-03-09 15:13:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000045672_23384064.pth
+[2023-03-09 15:14:00,740][744402] Updated weights for policy 0, policy_version 46240 (0.0005)
+[2023-03-09 15:14:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 23703552. Throughput: 0: 9128.4. Samples: 23704728. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:14:03,995][744089] Avg episode reward: [(0, '491.764')]
+[2023-03-09 15:14:05,146][744402] Updated weights for policy 0, policy_version 46320 (0.0005)
+[2023-03-09 15:14:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 23748608. Throughput: 0: 9161.6. Samples: 23732160. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:14:08,996][744089] Avg episode reward: [(0, '503.214')]
+[2023-03-09 15:14:09,721][744402] Updated weights for policy 0, policy_version 46400 (0.0004)
+[2023-03-09 15:14:13,988][744402] Updated weights for policy 0, policy_version 46480 (0.0005)
+[2023-03-09 15:14:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 23797760. Throughput: 0: 9140.0. Samples: 23785536. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:14:13,996][744089] Avg episode reward: [(0, '508.837')]
+[2023-03-09 15:14:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000046480_23797760.pth...
+[2023-03-09 15:14:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000045936_23519232.pth
+[2023-03-09 15:14:18,681][744402] Updated weights for policy 0, policy_version 46560 (0.0005)
+[2023-03-09 15:14:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 23838720. Throughput: 0: 9134.0. Samples: 23839860. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:14:18,995][744089] Avg episode reward: [(0, '486.362')]
+[2023-03-09 15:14:23,285][744402] Updated weights for policy 0, policy_version 46640 (0.0005)
+[2023-03-09 15:14:23,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.4, 300 sec: 9163.9). Total num frames: 23883776. Throughput: 0: 9161.9. Samples: 23867456. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:14:23,995][744089] Avg episode reward: [(0, '514.764')]
+[2023-03-09 15:14:28,012][744402] Updated weights for policy 0, policy_version 46720 (0.0004)
+[2023-03-09 15:14:28,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 23928832. Throughput: 0: 9076.9. Samples: 23919788. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:14:28,996][744089] Avg episode reward: [(0, '485.736')]
+[2023-03-09 15:14:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000046736_23928832.pth...
+[2023-03-09 15:14:29,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000046208_23658496.pth
+[2023-03-09 15:14:32,767][744402] Updated weights for policy 0, policy_version 46800 (0.0005)
+[2023-03-09 15:14:33,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 23969792. Throughput: 0: 8977.1. Samples: 23971524. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:14:33,995][744089] Avg episode reward: [(0, '493.339')]
+[2023-03-09 15:14:37,134][744402] Updated weights for policy 0, policy_version 46880 (0.0005)
+[2023-03-09 15:14:38,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 24018944. Throughput: 0: 8922.5. Samples: 23998568. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:14:38,995][744089] Avg episode reward: [(0, '480.535')]
+[2023-03-09 15:14:41,605][744402] Updated weights for policy 0, policy_version 46960 (0.0005)
+[2023-03-09 15:14:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9150.0). Total num frames: 24059904. Throughput: 0: 8977.2. Samples: 24054272. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:14:43,995][744089] Avg episode reward: [(0, '492.839')]
+[2023-03-09 15:14:44,002][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000047000_24064000.pth...
+[2023-03-09 15:14:44,004][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000046480_23797760.pth
+[2023-03-09 15:14:46,201][744402] Updated weights for policy 0, policy_version 47040 (0.0005)
+[2023-03-09 15:14:48,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9163.9). Total num frames: 24109056. Throughput: 0: 8983.6. Samples: 24108988. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:14:48,996][744089] Avg episode reward: [(0, '493.708')]
+[2023-03-09 15:14:50,783][744402] Updated weights for policy 0, policy_version 47120 (0.0005)
+[2023-03-09 15:14:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9150.0). Total num frames: 24150016. Throughput: 0: 8946.6. Samples: 24134756. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:14:53,995][744089] Avg episode reward: [(0, '395.425')]
+[2023-03-09 15:14:55,423][744402] Updated weights for policy 0, policy_version 47200 (0.0005)
+[2023-03-09 15:14:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9163.9). Total num frames: 24199168. Throughput: 0: 8974.7. Samples: 24189396. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:14:58,996][744089] Avg episode reward: [(0, '451.946')]
+[2023-03-09 15:14:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000047264_24199168.pth...
+[2023-03-09 15:14:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000046736_23928832.pth
+[2023-03-09 15:14:59,799][744402] Updated weights for policy 0, policy_version 47280 (0.0005)
+[2023-03-09 15:15:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9011.2, 300 sec: 9150.0). Total num frames: 24244224. Throughput: 0: 8970.6. Samples: 24243536. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:15:03,996][744089] Avg episode reward: [(0, '505.371')]
+[2023-03-09 15:15:04,369][744402] Updated weights for policy 0, policy_version 47360 (0.0005)
+[2023-03-09 15:15:08,671][744402] Updated weights for policy 0, policy_version 47440 (0.0005)
+[2023-03-09 15:15:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9150.1). Total num frames: 24289280. Throughput: 0: 8957.4. Samples: 24270540. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:15:08,995][744089] Avg episode reward: [(0, '506.877')]
+[2023-03-09 15:15:13,047][744402] Updated weights for policy 0, policy_version 47520 (0.0006)
+[2023-03-09 15:15:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9150.0). Total num frames: 24338432. Throughput: 0: 9078.3. Samples: 24328308. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:15:13,995][744089] Avg episode reward: [(0, '473.446')]
+[2023-03-09 15:15:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000047536_24338432.pth...
+[2023-03-09 15:15:14,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000047000_24064000.pth
+[2023-03-09 15:15:17,644][744402] Updated weights for policy 0, policy_version 47600 (0.0005)
+[2023-03-09 15:15:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 24379392. Throughput: 0: 9107.5. Samples: 24381360. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:15:18,995][744089] Avg episode reward: [(0, '498.927')]
+[2023-03-09 15:15:22,325][744402] Updated weights for policy 0, policy_version 47680 (0.0005)
+[2023-03-09 15:15:23,995][744089] Fps is (10 sec: 8601.5, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 24424448. Throughput: 0: 9100.1. Samples: 24408076. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:15:23,996][744089] Avg episode reward: [(0, '495.617')]
+[2023-03-09 15:15:26,735][744402] Updated weights for policy 0, policy_version 47760 (0.0005)
+[2023-03-09 15:15:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 24469504. Throughput: 0: 9047.6. Samples: 24461412. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:15:28,995][744089] Avg episode reward: [(0, '461.246')]
+[2023-03-09 15:15:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000047792_24469504.pth...
+[2023-03-09 15:15:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000047264_24199168.pth
+[2023-03-09 15:15:31,573][744402] Updated weights for policy 0, policy_version 47840 (0.0005)
+[2023-03-09 15:15:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 24514560. Throughput: 0: 9025.8. Samples: 24515148. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:15:33,995][744089] Avg episode reward: [(0, '350.031')]
+[2023-03-09 15:15:35,978][744402] Updated weights for policy 0, policy_version 47920 (0.0005)
+[2023-03-09 15:15:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 24559616. Throughput: 0: 9077.4. Samples: 24543240. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:15:38,995][744089] Avg episode reward: [(0, '449.785')]
+[2023-03-09 15:15:40,397][744402] Updated weights for policy 0, policy_version 48000 (0.0005)
+[2023-03-09 15:15:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 24608768. Throughput: 0: 9092.2. Samples: 24598544. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:15:43,996][744089] Avg episode reward: [(0, '484.835')]
+[2023-03-09 15:15:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000048064_24608768.pth...
+[2023-03-09 15:15:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000047536_24338432.pth
+[2023-03-09 15:15:44,867][744402] Updated weights for policy 0, policy_version 48080 (0.0005)
+[2023-03-09 15:15:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 24653824. Throughput: 0: 9118.9. Samples: 24653888. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:15:48,996][744089] Avg episode reward: [(0, '354.298')]
+[2023-03-09 15:15:49,304][744402] Updated weights for policy 0, policy_version 48160 (0.0005)
+[2023-03-09 15:15:53,699][744402] Updated weights for policy 0, policy_version 48240 (0.0004)
+[2023-03-09 15:15:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 24698880. Throughput: 0: 9151.1. Samples: 24682340. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:15:53,995][744089] Avg episode reward: [(0, '300.786')]
+[2023-03-09 15:15:58,073][744402] Updated weights for policy 0, policy_version 48320 (0.0005)
+[2023-03-09 15:15:58,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 24743936. Throughput: 0: 9100.4. Samples: 24737828. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:15:58,995][744089] Avg episode reward: [(0, '392.547')]
+[2023-03-09 15:15:59,011][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000048336_24748032.pth...
+[2023-03-09 15:15:59,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000047792_24469504.pth
+[2023-03-09 15:16:02,486][744402] Updated weights for policy 0, policy_version 48400 (0.0005)
+[2023-03-09 15:16:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 24793088. Throughput: 0: 9144.8. Samples: 24792876. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:03,995][744089] Avg episode reward: [(0, '495.505')]
+[2023-03-09 15:16:07,038][744402] Updated weights for policy 0, policy_version 48480 (0.0005)
+[2023-03-09 15:16:08,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 24838144. Throughput: 0: 9155.3. Samples: 24820064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:08,996][744089] Avg episode reward: [(0, '499.030')]
+[2023-03-09 15:16:11,281][744402] Updated weights for policy 0, policy_version 48560 (0.0004)
+[2023-03-09 15:16:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 24887296. Throughput: 0: 9252.3. Samples: 24877768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:13,996][744089] Avg episode reward: [(0, '484.584')]
+[2023-03-09 15:16:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000048608_24887296.pth...
+[2023-03-09 15:16:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000048064_24608768.pth
+[2023-03-09 15:16:15,786][744402] Updated weights for policy 0, policy_version 48640 (0.0005)
+[2023-03-09 15:16:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 24932352. Throughput: 0: 9257.3. Samples: 24931728. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:18,995][744089] Avg episode reward: [(0, '446.855')]
+[2023-03-09 15:16:20,257][744402] Updated weights for policy 0, policy_version 48720 (0.0005)
+[2023-03-09 15:16:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 24977408. Throughput: 0: 9282.7. Samples: 24960960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:23,995][744089] Avg episode reward: [(0, '450.094')]
+[2023-03-09 15:16:24,524][744402] Updated weights for policy 0, policy_version 48800 (0.0004)
+[2023-03-09 15:16:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 25022464. Throughput: 0: 9239.8. Samples: 25014336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:28,996][744089] Avg episode reward: [(0, '467.376')]
+[2023-03-09 15:16:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000048872_25022464.pth...
+[2023-03-09 15:16:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000048336_24748032.pth
+[2023-03-09 15:16:29,238][744402] Updated weights for policy 0, policy_version 48880 (0.0005)
+[2023-03-09 15:16:33,772][744402] Updated weights for policy 0, policy_version 48960 (0.0005)
+[2023-03-09 15:16:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9094.5). Total num frames: 25067520. Throughput: 0: 9193.4. Samples: 25067592. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:33,995][744089] Avg episode reward: [(0, '492.694')]
+[2023-03-09 15:16:37,921][744402] Updated weights for policy 0, policy_version 49040 (0.0005)
+[2023-03-09 15:16:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9108.4). Total num frames: 25116672. Throughput: 0: 9238.8. Samples: 25098088. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:38,995][744089] Avg episode reward: [(0, '459.249')]
+[2023-03-09 15:16:42,560][744402] Updated weights for policy 0, policy_version 49120 (0.0006)
+[2023-03-09 15:16:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 25161728. Throughput: 0: 9202.5. Samples: 25151940. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:43,996][744089] Avg episode reward: [(0, '483.784')]
+[2023-03-09 15:16:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000049144_25161728.pth...
+[2023-03-09 15:16:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000048608_24887296.pth
+[2023-03-09 15:16:47,278][744402] Updated weights for policy 0, policy_version 49200 (0.0005)
+[2023-03-09 15:16:48,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 25202688. Throughput: 0: 9152.7. Samples: 25204748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:48,995][744089] Avg episode reward: [(0, '471.709')]
+[2023-03-09 15:16:51,810][744402] Updated weights for policy 0, policy_version 49280 (0.0005)
+[2023-03-09 15:16:53,995][744089] Fps is (10 sec: 8601.8, 60 sec: 9147.8, 300 sec: 9080.6). Total num frames: 25247744. Throughput: 0: 9141.4. Samples: 25231424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:53,995][744089] Avg episode reward: [(0, '495.612')]
+[2023-03-09 15:16:56,244][744402] Updated weights for policy 0, policy_version 49360 (0.0005)
+[2023-03-09 15:16:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 25292800. Throughput: 0: 9071.1. Samples: 25285968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:16:58,995][744089] Avg episode reward: [(0, '498.115')]
+[2023-03-09 15:16:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000049400_25292800.pth...
+[2023-03-09 15:16:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000048872_25022464.pth
+[2023-03-09 15:17:00,998][744402] Updated weights for policy 0, policy_version 49440 (0.0005)
+[2023-03-09 15:17:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 25337856. Throughput: 0: 9084.0. Samples: 25340508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:17:03,995][744089] Avg episode reward: [(0, '485.605')]
+[2023-03-09 15:17:05,289][744402] Updated weights for policy 0, policy_version 49520 (0.0005)
+[2023-03-09 15:17:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 25387008. Throughput: 0: 9028.2. Samples: 25367232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:17:08,996][744089] Avg episode reward: [(0, '410.714')]
+[2023-03-09 15:17:09,802][744402] Updated weights for policy 0, policy_version 49600 (0.0005)
+[2023-03-09 15:17:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 25432064. Throughput: 0: 9091.8. Samples: 25423464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:17:13,995][744089] Avg episode reward: [(0, '499.360')]
+[2023-03-09 15:17:13,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000049672_25432064.pth...
+[2023-03-09 15:17:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000049144_25161728.pth
+[2023-03-09 15:17:14,284][744402] Updated weights for policy 0, policy_version 49680 (0.0005)
+[2023-03-09 15:17:18,597][744402] Updated weights for policy 0, policy_version 49760 (0.0005)
+[2023-03-09 15:17:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9094.5). Total num frames: 25481216. Throughput: 0: 9151.9. Samples: 25479428. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:17:18,995][744089] Avg episode reward: [(0, '384.454')]
+[2023-03-09 15:17:23,059][744402] Updated weights for policy 0, policy_version 49840 (0.0005)
+[2023-03-09 15:17:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 25522176. Throughput: 0: 9093.9. Samples: 25507312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:17:23,995][744089] Avg episode reward: [(0, '438.942')]
+[2023-03-09 15:17:27,657][744402] Updated weights for policy 0, policy_version 49920 (0.0005)
+[2023-03-09 15:17:28,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 25567232. Throughput: 0: 9075.7. Samples: 25560344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:17:28,995][744089] Avg episode reward: [(0, '470.943')]
+[2023-03-09 15:17:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000049936_25567232.pth...
+[2023-03-09 15:17:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000049400_25292800.pth
+[2023-03-09 15:17:32,435][744402] Updated weights for policy 0, policy_version 50000 (0.0005)
+[2023-03-09 15:17:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9080.6). Total num frames: 25612288. Throughput: 0: 9072.6. Samples: 25613016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:17:33,995][744089] Avg episode reward: [(0, '426.422')]
+[2023-03-09 15:17:36,960][744402] Updated weights for policy 0, policy_version 50080 (0.0005)
+[2023-03-09 15:17:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 25657344. Throughput: 0: 9094.4. Samples: 25640672. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:17:38,995][744089] Avg episode reward: [(0, '492.352')]
+[2023-03-09 15:17:41,164][744402] Updated weights for policy 0, policy_version 50160 (0.0005)
+[2023-03-09 15:17:43,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 25706496. Throughput: 0: 9132.3. Samples: 25696924. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:17:43,996][744089] Avg episode reward: [(0, '438.418')]
+[2023-03-09 15:17:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000050208_25706496.pth...
+[2023-03-09 15:17:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000049672_25432064.pth
+[2023-03-09 15:17:45,656][744402] Updated weights for policy 0, policy_version 50240 (0.0005)
+[2023-03-09 15:17:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9094.5). Total num frames: 25751552. Throughput: 0: 9158.8. Samples: 25752652. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:17:48,995][744089] Avg episode reward: [(0, '468.313')]
+[2023-03-09 15:17:50,107][744402] Updated weights for policy 0, policy_version 50320 (0.0005)
+[2023-03-09 15:17:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 25800704. Throughput: 0: 9188.1. Samples: 25780696. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:17:53,996][744089] Avg episode reward: [(0, '466.941')]
+[2023-03-09 15:17:54,385][744402] Updated weights for policy 0, policy_version 50400 (0.0005)
+[2023-03-09 15:17:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 25841664. Throughput: 0: 9155.7. Samples: 25835472. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:17:58,995][744089] Avg episode reward: [(0, '421.416')]
+[2023-03-09 15:17:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000050472_25841664.pth...
+[2023-03-09 15:17:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000049936_25567232.pth
+[2023-03-09 15:17:59,100][744402] Updated weights for policy 0, policy_version 50480 (0.0005)
+[2023-03-09 15:18:03,491][744402] Updated weights for policy 0, policy_version 50560 (0.0005)
+[2023-03-09 15:18:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 25890816. Throughput: 0: 9139.6. Samples: 25890708. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:18:03,995][744089] Avg episode reward: [(0, '454.013')]
+[2023-03-09 15:18:08,063][744402] Updated weights for policy 0, policy_version 50640 (0.0006)
+[2023-03-09 15:18:08,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 25935872. Throughput: 0: 9082.5. Samples: 25916028. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:09,006][744089] Avg episode reward: [(0, '442.075')]
+[2023-03-09 15:18:12,611][744402] Updated weights for policy 0, policy_version 50720 (0.0006)
+[2023-03-09 15:18:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 25980928. Throughput: 0: 9121.1. Samples: 25970796. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:13,996][744089] Avg episode reward: [(0, '406.432')]
+[2023-03-09 15:18:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000050744_25980928.pth...
+[2023-03-09 15:18:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000050208_25706496.pth
+[2023-03-09 15:18:17,005][744402] Updated weights for policy 0, policy_version 50800 (0.0005)
+[2023-03-09 15:18:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 26025984. Throughput: 0: 9175.7. Samples: 26025924. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:18,995][744089] Avg episode reward: [(0, '373.548')]
+[2023-03-09 15:18:21,545][744402] Updated weights for policy 0, policy_version 50880 (0.0005)
+[2023-03-09 15:18:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 26071040. Throughput: 0: 9171.6. Samples: 26053396. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:23,995][744089] Avg episode reward: [(0, '283.844')]
+[2023-03-09 15:18:26,035][744402] Updated weights for policy 0, policy_version 50960 (0.0006)
+[2023-03-09 15:18:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 26120192. Throughput: 0: 9178.9. Samples: 26109976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:28,996][744089] Avg episode reward: [(0, '411.601')]
+[2023-03-09 15:18:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000051016_26120192.pth...
+[2023-03-09 15:18:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000050472_25841664.pth
+[2023-03-09 15:18:30,199][744402] Updated weights for policy 0, policy_version 51040 (0.0005)
+[2023-03-09 15:18:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 26165248. Throughput: 0: 9170.4. Samples: 26165320. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:33,995][744089] Avg episode reward: [(0, '411.683')]
+[2023-03-09 15:18:34,745][744402] Updated weights for policy 0, policy_version 51120 (0.0005)
+[2023-03-09 15:18:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 26210304. Throughput: 0: 9153.9. Samples: 26192620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:39,006][744089] Avg episode reward: [(0, '427.635')]
+[2023-03-09 15:18:39,007][744402] Updated weights for policy 0, policy_version 51200 (0.0005)
+[2023-03-09 15:18:43,388][744402] Updated weights for policy 0, policy_version 51280 (0.0005)
+[2023-03-09 15:18:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 26259456. Throughput: 0: 9233.0. Samples: 26250956. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:44,006][744089] Avg episode reward: [(0, '341.398')]
+[2023-03-09 15:18:44,010][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000051288_26259456.pth...
+[2023-03-09 15:18:44,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000050744_25980928.pth
+[2023-03-09 15:18:48,164][744402] Updated weights for policy 0, policy_version 51360 (0.0004)
+[2023-03-09 15:18:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 26300416. Throughput: 0: 9144.1. Samples: 26302192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:48,995][744089] Avg episode reward: [(0, '235.527')]
+[2023-03-09 15:18:52,612][744402] Updated weights for policy 0, policy_version 51440 (0.0005)
+[2023-03-09 15:18:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 26349568. Throughput: 0: 9179.4. Samples: 26329100. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:53,996][744089] Avg episode reward: [(0, '328.739')]
+[2023-03-09 15:18:57,190][744402] Updated weights for policy 0, policy_version 51520 (0.0005)
+[2023-03-09 15:18:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 26394624. Throughput: 0: 9217.8. Samples: 26385596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:18:58,996][744089] Avg episode reward: [(0, '302.249')]
+[2023-03-09 15:18:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000051552_26394624.pth...
+[2023-03-09 15:18:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000051016_26120192.pth
+[2023-03-09 15:19:01,673][744402] Updated weights for policy 0, policy_version 51600 (0.0005)
+[2023-03-09 15:19:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 26439680. Throughput: 0: 9171.3. Samples: 26438632. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:19:03,996][744089] Avg episode reward: [(0, '487.101')]
+[2023-03-09 15:19:06,220][744402] Updated weights for policy 0, policy_version 51680 (0.0005)
+[2023-03-09 15:19:08,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9147.8, 300 sec: 9108.4). Total num frames: 26484736. Throughput: 0: 9184.8. Samples: 26466712. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:19:08,995][744089] Avg episode reward: [(0, '468.497')]
+[2023-03-09 15:19:10,536][744402] Updated weights for policy 0, policy_version 51760 (0.0004)
+[2023-03-09 15:19:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.8, 300 sec: 9122.3). Total num frames: 26529792. Throughput: 0: 9148.6. Samples: 26521664. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:19:13,995][744089] Avg episode reward: [(0, '459.675')]
+[2023-03-09 15:19:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000051816_26529792.pth...
+[2023-03-09 15:19:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000051288_26259456.pth
+[2023-03-09 15:19:15,032][744402] Updated weights for policy 0, policy_version 51840 (0.0005)
+[2023-03-09 15:19:18,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 26574848. Throughput: 0: 9132.3. Samples: 26576272. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:19:18,995][744089] Avg episode reward: [(0, '495.695')]
+[2023-03-09 15:19:19,512][744402] Updated weights for policy 0, policy_version 51920 (0.0004)
+[2023-03-09 15:19:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 26619904. Throughput: 0: 9132.6. Samples: 26603584. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:19:23,995][744089] Avg episode reward: [(0, '495.550')]
+[2023-03-09 15:19:24,145][744402] Updated weights for policy 0, policy_version 52000 (0.0005)
+[2023-03-09 15:19:28,238][744402] Updated weights for policy 0, policy_version 52080 (0.0005)
+[2023-03-09 15:19:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9150.0). Total num frames: 26669056. Throughput: 0: 9110.5. Samples: 26660928. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:19:28,995][744089] Avg episode reward: [(0, '467.171')]
+[2023-03-09 15:19:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000052088_26669056.pth...
+[2023-03-09 15:19:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000051552_26394624.pth
+[2023-03-09 15:19:32,594][744402] Updated weights for policy 0, policy_version 52160 (0.0004)
+[2023-03-09 15:19:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 26718208. Throughput: 0: 9242.0. Samples: 26718084. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:19:33,995][744089] Avg episode reward: [(0, '418.082')]
+[2023-03-09 15:19:36,882][744402] Updated weights for policy 0, policy_version 52240 (0.0005)
+[2023-03-09 15:19:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 26767360. Throughput: 0: 9281.0. Samples: 26746744. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:19:38,995][744089] Avg episode reward: [(0, '494.947')]
+[2023-03-09 15:19:41,069][744402] Updated weights for policy 0, policy_version 52320 (0.0005)
+[2023-03-09 15:19:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 26812416. Throughput: 0: 9300.4. Samples: 26804116. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:19:43,995][744089] Avg episode reward: [(0, '476.920')]
+[2023-03-09 15:19:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000052368_26812416.pth...
+[2023-03-09 15:19:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000051816_26529792.pth
+[2023-03-09 15:19:45,787][744402] Updated weights for policy 0, policy_version 52400 (0.0005)
+[2023-03-09 15:19:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 26857472. Throughput: 0: 9309.0. Samples: 26857536. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:19:48,996][744089] Avg episode reward: [(0, '463.523')]
+[2023-03-09 15:19:50,161][744402] Updated weights for policy 0, policy_version 52480 (0.0005)
+[2023-03-09 15:19:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 26902528. Throughput: 0: 9308.3. Samples: 26885588. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:19:53,996][744089] Avg episode reward: [(0, '471.381')]
+[2023-03-09 15:19:54,717][744402] Updated weights for policy 0, policy_version 52560 (0.0005)
+[2023-03-09 15:19:58,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 26947584. Throughput: 0: 9284.3. Samples: 26939456. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:19:58,995][744089] Avg episode reward: [(0, '414.744')]
+[2023-03-09 15:19:59,020][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000052640_26951680.pth...
+[2023-03-09 15:19:59,021][744402] Updated weights for policy 0, policy_version 52640 (0.0005)
+[2023-03-09 15:19:59,022][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000052088_26669056.pth
+[2023-03-09 15:20:03,572][744402] Updated weights for policy 0, policy_version 52720 (0.0005)
+[2023-03-09 15:20:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 26996736. Throughput: 0: 9314.5. Samples: 26995424. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:20:03,995][744089] Avg episode reward: [(0, '461.483')]
+[2023-03-09 15:20:07,913][744402] Updated weights for policy 0, policy_version 52800 (0.0005)
+[2023-03-09 15:20:08,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.2, 300 sec: 9163.9). Total num frames: 27041792. Throughput: 0: 9288.2. Samples: 27021552. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:20:08,996][744089] Avg episode reward: [(0, '366.798')]
+[2023-03-09 15:20:12,159][744402] Updated weights for policy 0, policy_version 52880 (0.0005)
+[2023-03-09 15:20:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9352.5, 300 sec: 9191.7). Total num frames: 27090944. Throughput: 0: 9333.3. Samples: 27080928. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:20:13,995][744089] Avg episode reward: [(0, '305.269')]
+[2023-03-09 15:20:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000052912_27090944.pth...
+[2023-03-09 15:20:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000052368_26812416.pth
+[2023-03-09 15:20:16,526][744402] Updated weights for policy 0, policy_version 52960 (0.0005)
+[2023-03-09 15:20:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9191.7). Total num frames: 27136000. Throughput: 0: 9300.9. Samples: 27136624. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:20:18,995][744089] Avg episode reward: [(0, '403.511')]
+[2023-03-09 15:20:20,709][744402] Updated weights for policy 0, policy_version 53040 (0.0005)
+[2023-03-09 15:20:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9205.6). Total num frames: 27185152. Throughput: 0: 9324.5. Samples: 27166348. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:20:23,996][744089] Avg episode reward: [(0, '427.682')]
+[2023-03-09 15:20:25,291][744402] Updated weights for policy 0, policy_version 53120 (0.0005)
+[2023-03-09 15:20:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9205.6). Total num frames: 27230208. Throughput: 0: 9288.1. Samples: 27222080. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:20:28,995][744089] Avg episode reward: [(0, '374.218')]
+[2023-03-09 15:20:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000053184_27230208.pth...
+[2023-03-09 15:20:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000052640_26951680.pth
+[2023-03-09 15:20:29,425][744402] Updated weights for policy 0, policy_version 53200 (0.0005)
+[2023-03-09 15:20:33,977][744402] Updated weights for policy 0, policy_version 53280 (0.0005)
+[2023-03-09 15:20:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9352.5, 300 sec: 9219.5). Total num frames: 27279360. Throughput: 0: 9364.0. Samples: 27278916. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:20:33,996][744089] Avg episode reward: [(0, '418.145')]
+[2023-03-09 15:20:38,280][744402] Updated weights for policy 0, policy_version 53360 (0.0005)
+[2023-03-09 15:20:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9205.6). Total num frames: 27324416. Throughput: 0: 9351.0. Samples: 27306380. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:20:38,995][744089] Avg episode reward: [(0, '434.081')]
+[2023-03-09 15:20:42,573][744402] Updated weights for policy 0, policy_version 53440 (0.0006)
+[2023-03-09 15:20:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9219.5). Total num frames: 27373568. Throughput: 0: 9435.3. Samples: 27364044. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:20:44,006][744089] Avg episode reward: [(0, '400.803')]
+[2023-03-09 15:20:44,010][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000053464_27373568.pth...
+[2023-03-09 15:20:44,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000052912_27090944.pth
+[2023-03-09 15:20:47,208][744402] Updated weights for policy 0, policy_version 53520 (0.0005)
+[2023-03-09 15:20:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9205.6). Total num frames: 27414528. Throughput: 0: 9342.0. Samples: 27415816. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:20:48,995][744089] Avg episode reward: [(0, '397.214')]
+[2023-03-09 15:20:51,623][744402] Updated weights for policy 0, policy_version 53600 (0.0005)
+[2023-03-09 15:20:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9219.5). Total num frames: 27463680. Throughput: 0: 9414.5. Samples: 27445204. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:20:53,995][744089] Avg episode reward: [(0, '458.042')]
+[2023-03-09 15:20:56,015][744402] Updated weights for policy 0, policy_version 53680 (0.0005)
+[2023-03-09 15:20:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9352.5, 300 sec: 9205.6). Total num frames: 27508736. Throughput: 0: 9326.2. Samples: 27500608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:20:58,996][744089] Avg episode reward: [(0, '473.621')]
+[2023-03-09 15:20:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000053728_27508736.pth...
+[2023-03-09 15:20:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000053184_27230208.pth
+[2023-03-09 15:21:00,496][744402] Updated weights for policy 0, policy_version 53760 (0.0005)
+[2023-03-09 15:21:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9205.6). Total num frames: 27553792. Throughput: 0: 9314.8. Samples: 27555788. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:21:03,995][744089] Avg episode reward: [(0, '427.935')]
+[2023-03-09 15:21:05,038][744402] Updated weights for policy 0, policy_version 53840 (0.0004)
+[2023-03-09 15:21:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9205.6). Total num frames: 27602944. Throughput: 0: 9247.0. Samples: 27582464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:21:08,996][744089] Avg episode reward: [(0, '441.969')]
+[2023-03-09 15:21:09,398][744402] Updated weights for policy 0, policy_version 53920 (0.0006)
+[2023-03-09 15:21:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9191.7). Total num frames: 27643904. Throughput: 0: 9223.1. Samples: 27637120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:21:13,995][744089] Avg episode reward: [(0, '470.501')]
+[2023-03-09 15:21:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000054000_27648000.pth...
+[2023-03-09 15:21:13,999][744402] Updated weights for policy 0, policy_version 54000 (0.0005)
+[2023-03-09 15:21:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000053464_27373568.pth
+[2023-03-09 15:21:18,449][744402] Updated weights for policy 0, policy_version 54080 (0.0005)
+[2023-03-09 15:21:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9205.6). Total num frames: 27693056. Throughput: 0: 9203.1. Samples: 27693056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:21:18,995][744089] Avg episode reward: [(0, '425.105')]
+[2023-03-09 15:21:22,825][744402] Updated weights for policy 0, policy_version 54160 (0.0005)
+[2023-03-09 15:21:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9284.3, 300 sec: 9219.5). Total num frames: 27742208. Throughput: 0: 9176.3. Samples: 27719312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:21:23,995][744089] Avg episode reward: [(0, '392.632')]
+[2023-03-09 15:21:27,157][744402] Updated weights for policy 0, policy_version 54240 (0.0005)
+[2023-03-09 15:21:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9205.6). Total num frames: 27783168. Throughput: 0: 9171.5. Samples: 27776760. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:21:28,995][744089] Avg episode reward: [(0, '471.177')]
+[2023-03-09 15:21:29,042][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000054272_27787264.pth...
+[2023-03-09 15:21:29,043][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000053728_27508736.pth
+[2023-03-09 15:21:31,686][744402] Updated weights for policy 0, policy_version 54320 (0.0005)
+[2023-03-09 15:21:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9205.6). Total num frames: 27832320. Throughput: 0: 9249.1. Samples: 27832028. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:21:33,995][744089] Avg episode reward: [(0, '474.403')]
+[2023-03-09 15:21:36,204][744402] Updated weights for policy 0, policy_version 54400 (0.0004)
+[2023-03-09 15:21:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9205.6). Total num frames: 27877376. Throughput: 0: 9190.3. Samples: 27858768. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:21:38,995][744089] Avg episode reward: [(0, '474.864')]
+[2023-03-09 15:21:40,731][744402] Updated weights for policy 0, policy_version 54480 (0.0005)
+[2023-03-09 15:21:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9219.5). Total num frames: 27922432. Throughput: 0: 9153.4. Samples: 27912512. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:21:43,995][744089] Avg episode reward: [(0, '417.882')]
+[2023-03-09 15:21:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000054536_27922432.pth...
+[2023-03-09 15:21:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000054000_27648000.pth
+[2023-03-09 15:21:45,212][744402] Updated weights for policy 0, policy_version 54560 (0.0005)
+[2023-03-09 15:21:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9219.5). Total num frames: 27967488. Throughput: 0: 9166.7. Samples: 27968292. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:21:48,995][744089] Avg episode reward: [(0, '448.824')]
+[2023-03-09 15:21:49,665][744402] Updated weights for policy 0, policy_version 54640 (0.0005)
+[2023-03-09 15:21:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9219.5). Total num frames: 28012544. Throughput: 0: 9194.7. Samples: 27996224. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:21:53,995][744089] Avg episode reward: [(0, '416.787')]
+[2023-03-09 15:21:53,998][744402] Updated weights for policy 0, policy_version 54720 (0.0005)
+[2023-03-09 15:21:58,286][744402] Updated weights for policy 0, policy_version 54800 (0.0005)
+[2023-03-09 15:21:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9233.4). Total num frames: 28061696. Throughput: 0: 9253.2. Samples: 28053516. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:21:58,995][744089] Avg episode reward: [(0, '387.791')]
+[2023-03-09 15:21:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000054808_28061696.pth...
+[2023-03-09 15:21:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000054272_27787264.pth
+[2023-03-09 15:22:02,707][744402] Updated weights for policy 0, policy_version 54880 (0.0005)
+[2023-03-09 15:22:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9219.5). Total num frames: 28106752. Throughput: 0: 9230.9. Samples: 28108444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:03,995][744089] Avg episode reward: [(0, '329.507')]
+[2023-03-09 15:22:07,062][744402] Updated weights for policy 0, policy_version 54960 (0.0005)
+[2023-03-09 15:22:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9233.4). Total num frames: 28155904. Throughput: 0: 9306.9. Samples: 28138124. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:08,995][744089] Avg episode reward: [(0, '429.358')]
+[2023-03-09 15:22:11,185][744402] Updated weights for policy 0, policy_version 55040 (0.0005)
+[2023-03-09 15:22:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9352.5, 300 sec: 9233.4). Total num frames: 28205056. Throughput: 0: 9310.3. Samples: 28195724. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:13,995][744089] Avg episode reward: [(0, '400.839')]
+[2023-03-09 15:22:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000055088_28205056.pth...
+[2023-03-09 15:22:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000054536_27922432.pth
+[2023-03-09 15:22:15,606][744402] Updated weights for policy 0, policy_version 55120 (0.0005)
+[2023-03-09 15:22:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9247.2). Total num frames: 28250112. Throughput: 0: 9330.5. Samples: 28251900. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:18,995][744089] Avg episode reward: [(0, '433.706')]
+[2023-03-09 15:22:19,886][744402] Updated weights for policy 0, policy_version 55200 (0.0005)
+[2023-03-09 15:22:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9261.1). Total num frames: 28299264. Throughput: 0: 9357.7. Samples: 28279864. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:23,995][744089] Avg episode reward: [(0, '354.658')]
+[2023-03-09 15:22:24,294][744402] Updated weights for policy 0, policy_version 55280 (0.0005)
+[2023-03-09 15:22:28,654][744402] Updated weights for policy 0, policy_version 55360 (0.0004)
+[2023-03-09 15:22:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9352.5, 300 sec: 9261.1). Total num frames: 28344320. Throughput: 0: 9414.0. Samples: 28336140. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:28,995][744089] Avg episode reward: [(0, '381.787')]
+[2023-03-09 15:22:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000055360_28344320.pth...
+[2023-03-09 15:22:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000054808_28061696.pth
+[2023-03-09 15:22:32,992][744402] Updated weights for policy 0, policy_version 55440 (0.0005)
+[2023-03-09 15:22:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9275.0). Total num frames: 28393472. Throughput: 0: 9447.0. Samples: 28393408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:33,996][744089] Avg episode reward: [(0, '346.819')]
+[2023-03-09 15:22:37,050][744402] Updated weights for policy 0, policy_version 55520 (0.0005)
+[2023-03-09 15:22:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9420.8, 300 sec: 9275.0). Total num frames: 28442624. Throughput: 0: 9501.3. Samples: 28423784. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:38,995][744089] Avg episode reward: [(0, '205.871')]
+[2023-03-09 15:22:41,327][744402] Updated weights for policy 0, policy_version 55600 (0.0005)
+[2023-03-09 15:22:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9288.9). Total num frames: 28491776. Throughput: 0: 9514.9. Samples: 28481688. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:43,996][744089] Avg episode reward: [(0, '308.561')]
+[2023-03-09 15:22:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000055648_28491776.pth...
+[2023-03-09 15:22:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000055088_28205056.pth
+[2023-03-09 15:22:45,545][744402] Updated weights for policy 0, policy_version 55680 (0.0005)
+[2023-03-09 15:22:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9288.9). Total num frames: 28540928. Throughput: 0: 9607.7. Samples: 28540792. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:48,995][744089] Avg episode reward: [(0, '303.405')]
+[2023-03-09 15:22:49,726][744402] Updated weights for policy 0, policy_version 55760 (0.0005)
+[2023-03-09 15:22:53,890][744402] Updated weights for policy 0, policy_version 55840 (0.0005)
+[2023-03-09 15:22:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9316.7). Total num frames: 28590080. Throughput: 0: 9598.8. Samples: 28570072. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:53,996][744089] Avg episode reward: [(0, '220.153')]
+[2023-03-09 15:22:58,367][744402] Updated weights for policy 0, policy_version 55920 (0.0005)
+[2023-03-09 15:22:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9302.8). Total num frames: 28635136. Throughput: 0: 9576.7. Samples: 28626676. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:22:58,996][744089] Avg episode reward: [(0, '306.618')]
+[2023-03-09 15:22:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000055928_28635136.pth...
+[2023-03-09 15:22:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000055360_28344320.pth
+[2023-03-09 15:23:02,959][744402] Updated weights for policy 0, policy_version 56000 (0.0005)
+[2023-03-09 15:23:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9557.3, 300 sec: 9302.8). Total num frames: 28680192. Throughput: 0: 9517.9. Samples: 28680204. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:23:03,995][744089] Avg episode reward: [(0, '291.985')]
+[2023-03-09 15:23:07,367][744402] Updated weights for policy 0, policy_version 56080 (0.0005)
+[2023-03-09 15:23:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9489.1, 300 sec: 9302.8). Total num frames: 28725248. Throughput: 0: 9531.7. Samples: 28708792. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:23:08,996][744089] Avg episode reward: [(0, '355.950')]
+[2023-03-09 15:23:11,810][744402] Updated weights for policy 0, policy_version 56160 (0.0005)
+[2023-03-09 15:23:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9489.1, 300 sec: 9316.7). Total num frames: 28774400. Throughput: 0: 9541.9. Samples: 28765524. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:23:13,996][744089] Avg episode reward: [(0, '322.606')]
+[2023-03-09 15:23:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000056200_28774400.pth...
+[2023-03-09 15:23:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000055648_28491776.pth
+[2023-03-09 15:23:15,812][744402] Updated weights for policy 0, policy_version 56240 (0.0005)
+[2023-03-09 15:23:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9330.5). Total num frames: 28823552. Throughput: 0: 9553.9. Samples: 28823332. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:23:18,996][744089] Avg episode reward: [(0, '388.023')]
+[2023-03-09 15:23:20,257][744402] Updated weights for policy 0, policy_version 56320 (0.0004)
+[2023-03-09 15:23:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9316.7). Total num frames: 28868608. Throughput: 0: 9496.7. Samples: 28851136. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:23:23,995][744089] Avg episode reward: [(0, '387.869')]
+[2023-03-09 15:23:24,517][744402] Updated weights for policy 0, policy_version 56400 (0.0004)
+[2023-03-09 15:23:28,965][744402] Updated weights for policy 0, policy_version 56480 (0.0004)
+[2023-03-09 15:23:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9330.5). Total num frames: 28917760. Throughput: 0: 9457.7. Samples: 28907284. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:23:28,996][744089] Avg episode reward: [(0, '392.609')]
+[2023-03-09 15:23:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000056480_28917760.pth...
+[2023-03-09 15:23:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000055928_28635136.pth
+[2023-03-09 15:23:33,456][744402] Updated weights for policy 0, policy_version 56560 (0.0005)
+[2023-03-09 15:23:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9330.6). Total num frames: 28962816. Throughput: 0: 9373.1. Samples: 28962580. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:23:33,995][744089] Avg episode reward: [(0, '445.777')]
+[2023-03-09 15:23:37,900][744402] Updated weights for policy 0, policy_version 56640 (0.0005)
+[2023-03-09 15:23:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9420.8, 300 sec: 9316.7). Total num frames: 29007872. Throughput: 0: 9318.9. Samples: 28989424. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:23:38,996][744089] Avg episode reward: [(0, '419.819')]
+[2023-03-09 15:23:41,993][744402] Updated weights for policy 0, policy_version 56720 (0.0005)
+[2023-03-09 15:23:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9344.4). Total num frames: 29057024. Throughput: 0: 9389.2. Samples: 29049188. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:23:43,995][744089] Avg episode reward: [(0, '423.390')]
+[2023-03-09 15:23:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000056752_29057024.pth...
+[2023-03-09 15:23:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000056200_28774400.pth
+[2023-03-09 15:23:46,205][744402] Updated weights for policy 0, policy_version 56800 (0.0005)
+[2023-03-09 15:23:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9344.4). Total num frames: 29106176. Throughput: 0: 9471.7. Samples: 29106432. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:23:48,995][744089] Avg episode reward: [(0, '335.278')]
+[2023-03-09 15:23:50,379][744402] Updated weights for policy 0, policy_version 56880 (0.0005)
+[2023-03-09 15:23:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 29155328. Throughput: 0: 9470.6. Samples: 29134968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:23:53,995][744089] Avg episode reward: [(0, '418.435')]
+[2023-03-09 15:23:54,864][744402] Updated weights for policy 0, policy_version 56960 (0.0005)
+[2023-03-09 15:23:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 29200384. Throughput: 0: 9497.9. Samples: 29192928. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:23:58,995][744089] Avg episode reward: [(0, '369.823')]
+[2023-03-09 15:23:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000057032_29200384.pth...
+[2023-03-09 15:23:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000056480_28917760.pth
+[2023-03-09 15:23:59,058][744402] Updated weights for policy 0, policy_version 57040 (0.0005)
+[2023-03-09 15:24:03,472][744402] Updated weights for policy 0, policy_version 57120 (0.0005)
+[2023-03-09 15:24:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9372.2). Total num frames: 29249536. Throughput: 0: 9470.3. Samples: 29249496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:03,995][744089] Avg episode reward: [(0, '381.776')]
+[2023-03-09 15:24:07,664][744402] Updated weights for policy 0, policy_version 57200 (0.0005)
+[2023-03-09 15:24:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9372.2). Total num frames: 29294592. Throughput: 0: 9490.7. Samples: 29278216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:08,995][744089] Avg episode reward: [(0, '394.614')]
+[2023-03-09 15:24:11,945][744402] Updated weights for policy 0, policy_version 57280 (0.0005)
+[2023-03-09 15:24:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9400.0). Total num frames: 29347840. Throughput: 0: 9547.2. Samples: 29336908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:13,996][744089] Avg episode reward: [(0, '406.613')]
+[2023-03-09 15:24:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000057320_29347840.pth...
+[2023-03-09 15:24:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000056752_29057024.pth
+[2023-03-09 15:24:16,239][744402] Updated weights for policy 0, policy_version 57360 (0.0005)
+[2023-03-09 15:24:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9400.0). Total num frames: 29392896. Throughput: 0: 9554.6. Samples: 29392536. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:18,995][744089] Avg episode reward: [(0, '385.906')]
+[2023-03-09 15:24:20,697][744402] Updated weights for policy 0, policy_version 57440 (0.0005)
+[2023-03-09 15:24:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9489.1, 300 sec: 9386.1). Total num frames: 29437952. Throughput: 0: 9551.7. Samples: 29419252. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:23,995][744089] Avg episode reward: [(0, '389.385')]
+[2023-03-09 15:24:25,276][744402] Updated weights for policy 0, policy_version 57520 (0.0004)
+[2023-03-09 15:24:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9420.8, 300 sec: 9372.2). Total num frames: 29483008. Throughput: 0: 9406.9. Samples: 29472500. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:28,995][744089] Avg episode reward: [(0, '301.365')]
+[2023-03-09 15:24:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000057584_29483008.pth...
+[2023-03-09 15:24:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000057032_29200384.pth
+[2023-03-09 15:24:29,829][744402] Updated weights for policy 0, policy_version 57600 (0.0005)
+[2023-03-09 15:24:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 29528064. Throughput: 0: 9358.5. Samples: 29527564. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:33,995][744089] Avg episode reward: [(0, '256.897')]
+[2023-03-09 15:24:34,397][744402] Updated weights for policy 0, policy_version 57680 (0.0005)
+[2023-03-09 15:24:38,718][744402] Updated weights for policy 0, policy_version 57760 (0.0005)
+[2023-03-09 15:24:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9420.8, 300 sec: 9358.3). Total num frames: 29573120. Throughput: 0: 9343.0. Samples: 29555404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:38,995][744089] Avg episode reward: [(0, '327.921')]
+[2023-03-09 15:24:43,062][744402] Updated weights for policy 0, policy_version 57840 (0.0005)
+[2023-03-09 15:24:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9372.2). Total num frames: 29622272. Throughput: 0: 9295.7. Samples: 29611236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:43,996][744089] Avg episode reward: [(0, '222.872')]
+[2023-03-09 15:24:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000057856_29622272.pth...
+[2023-03-09 15:24:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000057320_29347840.pth
+[2023-03-09 15:24:47,815][744402] Updated weights for policy 0, policy_version 57920 (0.0004)
+[2023-03-09 15:24:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9358.3). Total num frames: 29663232. Throughput: 0: 9227.3. Samples: 29664724. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:48,995][744089] Avg episode reward: [(0, '403.478')]
+[2023-03-09 15:24:49,585][744358] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000004
+[2023-03-09 15:24:52,173][744402] Updated weights for policy 0, policy_version 58000 (0.0005)
+[2023-03-09 15:24:53,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9216.0, 300 sec: 9358.3). Total num frames: 29708288. Throughput: 0: 9201.0. Samples: 29692260. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:24:53,995][744089] Avg episode reward: [(0, '337.891')]
+[2023-03-09 15:24:56,693][744402] Updated weights for policy 0, policy_version 58080 (0.0005)
+[2023-03-09 15:24:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9344.4). Total num frames: 29753344. Throughput: 0: 9116.6. Samples: 29747156. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:24:58,995][744089] Avg episode reward: [(0, '443.082')]
+[2023-03-09 15:24:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000058112_29753344.pth...
+[2023-03-09 15:24:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000057584_29483008.pth
+[2023-03-09 15:25:01,307][744402] Updated weights for policy 0, policy_version 58160 (0.0004)
+[2023-03-09 15:25:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9344.4). Total num frames: 29798400. Throughput: 0: 9058.3. Samples: 29800160. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:25:03,995][744089] Avg episode reward: [(0, '326.084')]
+[2023-03-09 15:25:05,932][744402] Updated weights for policy 0, policy_version 58240 (0.0004)
+[2023-03-09 15:25:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9330.6). Total num frames: 29843456. Throughput: 0: 9066.6. Samples: 29827248. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:25:08,995][744089] Avg episode reward: [(0, '406.330')]
+[2023-03-09 15:25:10,603][744402] Updated weights for policy 0, policy_version 58320 (0.0005)
+[2023-03-09 15:25:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9330.5). Total num frames: 29888512. Throughput: 0: 9062.9. Samples: 29880332. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:25:13,995][744089] Avg episode reward: [(0, '433.546')]
+[2023-03-09 15:25:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000058376_29888512.pth...
+[2023-03-09 15:25:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000057856_29622272.pth
+[2023-03-09 15:25:15,072][744402] Updated weights for policy 0, policy_version 58400 (0.0005)
+[2023-03-09 15:25:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9316.7). Total num frames: 29933568. Throughput: 0: 9045.7. Samples: 29934620. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:25:18,995][744089] Avg episode reward: [(0, '408.366')]
+[2023-03-09 15:25:19,466][744402] Updated weights for policy 0, policy_version 58480 (0.0005)
+[2023-03-09 15:25:23,763][744402] Updated weights for policy 0, policy_version 58560 (0.0005)
+[2023-03-09 15:25:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9330.5). Total num frames: 29982720. Throughput: 0: 9100.3. Samples: 29964916. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:25:23,996][744089] Avg episode reward: [(0, '409.781')]
+[2023-03-09 15:25:28,208][744402] Updated weights for policy 0, policy_version 58640 (0.0005)
+[2023-03-09 15:25:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9316.7). Total num frames: 30027776. Throughput: 0: 9074.9. Samples: 30019604. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:25:28,995][744089] Avg episode reward: [(0, '388.262')]
+[2023-03-09 15:25:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000058648_30027776.pth...
+[2023-03-09 15:25:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000058112_29753344.pth
+[2023-03-09 15:25:32,804][744402] Updated weights for policy 0, policy_version 58720 (0.0005)
+[2023-03-09 15:25:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9316.7). Total num frames: 30072832. Throughput: 0: 9108.2. Samples: 30074592. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:25:33,995][744089] Avg episode reward: [(0, '382.861')]
+[2023-03-09 15:25:37,327][744402] Updated weights for policy 0, policy_version 58800 (0.0004)
+[2023-03-09 15:25:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9302.8). Total num frames: 30117888. Throughput: 0: 9093.5. Samples: 30101468. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:25:38,995][744089] Avg episode reward: [(0, '436.234')]
+[2023-03-09 15:25:41,929][744402] Updated weights for policy 0, policy_version 58880 (0.0005)
+[2023-03-09 15:25:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9316.7). Total num frames: 30162944. Throughput: 0: 9059.1. Samples: 30154816. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:25:43,996][744089] Avg episode reward: [(0, '435.334')]
+[2023-03-09 15:25:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000058912_30162944.pth...
+[2023-03-09 15:25:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000058376_29888512.pth
+[2023-03-09 15:25:46,179][744402] Updated weights for policy 0, policy_version 58960 (0.0005)
+[2023-03-09 15:25:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9316.7). Total num frames: 30212096. Throughput: 0: 9173.2. Samples: 30212956. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:25:48,996][744089] Avg episode reward: [(0, '478.676')]
+[2023-03-09 15:25:50,389][744402] Updated weights for policy 0, policy_version 59040 (0.0004)
+[2023-03-09 15:25:51,230][744358] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000008
+[2023-03-09 15:25:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9216.0, 300 sec: 9330.6). Total num frames: 30261248. Throughput: 0: 9235.4. Samples: 30242844. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:25:53,996][744089] Avg episode reward: [(0, '465.323')]
+[2023-03-09 15:25:54,872][744402] Updated weights for policy 0, policy_version 59120 (0.0005)
+[2023-03-09 15:25:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9316.7). Total num frames: 30302208. Throughput: 0: 9226.3. Samples: 30295516. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:25:58,995][744089] Avg episode reward: [(0, '464.378')]
+[2023-03-09 15:25:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000059184_30302208.pth...
+[2023-03-09 15:25:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000058648_30027776.pth
+[2023-03-09 15:25:59,556][744402] Updated weights for policy 0, policy_version 59200 (0.0005)
+[2023-03-09 15:26:03,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9147.7, 300 sec: 9302.8). Total num frames: 30347264. Throughput: 0: 9189.5. Samples: 30348148. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:26:03,995][744089] Avg episode reward: [(0, '469.754')]
+[2023-03-09 15:26:04,089][744402] Updated weights for policy 0, policy_version 59280 (0.0004)
+[2023-03-09 15:26:08,816][744402] Updated weights for policy 0, policy_version 59360 (0.0005)
+[2023-03-09 15:26:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9316.7). Total num frames: 30392320. Throughput: 0: 9131.7. Samples: 30375840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:08,995][744089] Avg episode reward: [(0, '476.849')]
+[2023-03-09 15:26:12,970][744402] Updated weights for policy 0, policy_version 59440 (0.0005)
+[2023-03-09 15:26:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9316.7). Total num frames: 30441472. Throughput: 0: 9176.1. Samples: 30432528. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:13,995][744089] Avg episode reward: [(0, '420.667')]
+[2023-03-09 15:26:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000059456_30441472.pth...
+[2023-03-09 15:26:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000058912_30162944.pth
+[2023-03-09 15:26:17,536][744402] Updated weights for policy 0, policy_version 59520 (0.0005)
+[2023-03-09 15:26:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9302.8). Total num frames: 30486528. Throughput: 0: 9155.6. Samples: 30486592. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:18,995][744089] Avg episode reward: [(0, '468.807')]
+[2023-03-09 15:26:21,921][744402] Updated weights for policy 0, policy_version 59600 (0.0004)
+[2023-03-09 15:26:23,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9330.5). Total num frames: 30535680. Throughput: 0: 9185.8. Samples: 30514828. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:23,995][744089] Avg episode reward: [(0, '489.225')]
+[2023-03-09 15:26:26,104][744402] Updated weights for policy 0, policy_version 59680 (0.0005)
+[2023-03-09 15:26:28,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9216.0, 300 sec: 9316.7). Total num frames: 30580736. Throughput: 0: 9281.9. Samples: 30572504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:28,996][744089] Avg episode reward: [(0, '451.732')]
+[2023-03-09 15:26:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000059728_30580736.pth...
+[2023-03-09 15:26:29,004][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000059184_30302208.pth
+[2023-03-09 15:26:30,397][744402] Updated weights for policy 0, policy_version 59760 (0.0004)
+[2023-03-09 15:26:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9330.5). Total num frames: 30629888. Throughput: 0: 9260.0. Samples: 30629656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:33,995][744089] Avg episode reward: [(0, '414.916')]
+[2023-03-09 15:26:34,819][744402] Updated weights for policy 0, policy_version 59840 (0.0005)
+[2023-03-09 15:26:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9330.5). Total num frames: 30674944. Throughput: 0: 9221.2. Samples: 30657800. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:38,995][744089] Avg episode reward: [(0, '452.360')]
+[2023-03-09 15:26:39,248][744402] Updated weights for policy 0, policy_version 59920 (0.0005)
+[2023-03-09 15:26:43,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9216.0, 300 sec: 9316.7). Total num frames: 30715904. Throughput: 0: 9199.2. Samples: 30709480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:43,995][744089] Avg episode reward: [(0, '459.426')]
+[2023-03-09 15:26:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000059992_30715904.pth...
+[2023-03-09 15:26:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000059456_30441472.pth
+[2023-03-09 15:26:44,068][744402] Updated weights for policy 0, policy_version 60000 (0.0004)
+[2023-03-09 15:26:48,757][744402] Updated weights for policy 0, policy_version 60080 (0.0005)
+[2023-03-09 15:26:48,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9147.7, 300 sec: 9316.7). Total num frames: 30760960. Throughput: 0: 9177.3. Samples: 30761128. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:48,995][744089] Avg episode reward: [(0, '467.445')]
+[2023-03-09 15:26:53,446][744402] Updated weights for policy 0, policy_version 60160 (0.0005)
+[2023-03-09 15:26:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9302.8). Total num frames: 30806016. Throughput: 0: 9168.5. Samples: 30788424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:53,995][744089] Avg episode reward: [(0, '454.562')]
+[2023-03-09 15:26:57,925][744402] Updated weights for policy 0, policy_version 60240 (0.0005)
+[2023-03-09 15:26:58,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9147.7, 300 sec: 9302.8). Total num frames: 30851072. Throughput: 0: 9113.0. Samples: 30842616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:26:58,996][744089] Avg episode reward: [(0, '403.303')]
+[2023-03-09 15:26:59,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000060256_30851072.pth...
+[2023-03-09 15:26:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000059728_30580736.pth
+[2023-03-09 15:27:02,245][744402] Updated weights for policy 0, policy_version 60320 (0.0005)
+[2023-03-09 15:27:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9302.8). Total num frames: 30900224. Throughput: 0: 9173.5. Samples: 30899400. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:03,995][744089] Avg episode reward: [(0, '378.198')]
+[2023-03-09 15:27:06,624][744402] Updated weights for policy 0, policy_version 60400 (0.0005)
+[2023-03-09 15:27:08,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9216.0, 300 sec: 9288.9). Total num frames: 30945280. Throughput: 0: 9152.7. Samples: 30926700. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:08,995][744089] Avg episode reward: [(0, '472.682')]
+[2023-03-09 15:27:11,251][744402] Updated weights for policy 0, policy_version 60480 (0.0005)
+[2023-03-09 15:27:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9288.9). Total num frames: 30990336. Throughput: 0: 9032.1. Samples: 30978948. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:13,995][744089] Avg episode reward: [(0, '402.733')]
+[2023-03-09 15:27:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000060528_30990336.pth...
+[2023-03-09 15:27:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000059992_30715904.pth
+[2023-03-09 15:27:15,841][744402] Updated weights for policy 0, policy_version 60560 (0.0005)
+[2023-03-09 15:27:18,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9261.1). Total num frames: 31031296. Throughput: 0: 8981.4. Samples: 31033820. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:18,995][744089] Avg episode reward: [(0, '398.937')]
+[2023-03-09 15:27:20,545][744402] Updated weights for policy 0, policy_version 60640 (0.0005)
+[2023-03-09 15:27:23,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9275.0). Total num frames: 31080448. Throughput: 0: 8940.9. Samples: 31060140. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:23,995][744089] Avg episode reward: [(0, '428.142')]
+[2023-03-09 15:27:24,804][744402] Updated weights for policy 0, policy_version 60720 (0.0005)
+[2023-03-09 15:27:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9261.1). Total num frames: 31125504. Throughput: 0: 9051.8. Samples: 31116812. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:28,996][744089] Avg episode reward: [(0, '462.770')]
+[2023-03-09 15:27:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000060792_31125504.pth...
+[2023-03-09 15:27:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000060256_30851072.pth
+[2023-03-09 15:27:29,467][744402] Updated weights for policy 0, policy_version 60800 (0.0005)
+[2023-03-09 15:27:33,965][744402] Updated weights for policy 0, policy_version 60880 (0.0005)
+[2023-03-09 15:27:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9247.2). Total num frames: 31170560. Throughput: 0: 9085.5. Samples: 31169976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:33,995][744089] Avg episode reward: [(0, '378.813')]
+[2023-03-09 15:27:38,399][744402] Updated weights for policy 0, policy_version 60960 (0.0005)
+[2023-03-09 15:27:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9233.4). Total num frames: 31215616. Throughput: 0: 9080.3. Samples: 31197036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:38,995][744089] Avg episode reward: [(0, '474.689')]
+[2023-03-09 15:27:42,706][744402] Updated weights for policy 0, policy_version 61040 (0.0005)
+[2023-03-09 15:27:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9219.5). Total num frames: 31260672. Throughput: 0: 9125.1. Samples: 31253244. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:43,995][744089] Avg episode reward: [(0, '504.011')]
+[2023-03-09 15:27:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000061056_31260672.pth...
+[2023-03-09 15:27:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000060528_30990336.pth
+[2023-03-09 15:27:47,319][744402] Updated weights for policy 0, policy_version 61120 (0.0005)
+[2023-03-09 15:27:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9205.6). Total num frames: 31305728. Throughput: 0: 9057.6. Samples: 31306992. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:48,995][744089] Avg episode reward: [(0, '403.927')]
+[2023-03-09 15:27:51,847][744402] Updated weights for policy 0, policy_version 61200 (0.0006)
+[2023-03-09 15:27:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9205.6). Total num frames: 31350784. Throughput: 0: 9059.6. Samples: 31334384. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:53,995][744089] Avg episode reward: [(0, '418.239')]
+[2023-03-09 15:27:56,238][744402] Updated weights for policy 0, policy_version 61280 (0.0005)
+[2023-03-09 15:27:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9219.5). Total num frames: 31399936. Throughput: 0: 9156.3. Samples: 31390984. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:27:58,996][744089] Avg episode reward: [(0, '509.746')]
+[2023-03-09 15:27:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000061328_31399936.pth...
+[2023-03-09 15:27:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000060792_31125504.pth
+[2023-03-09 15:28:00,689][744402] Updated weights for policy 0, policy_version 61360 (0.0005)
+[2023-03-09 15:28:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9219.5). Total num frames: 31444992. Throughput: 0: 9138.8. Samples: 31445064. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:03,995][744089] Avg episode reward: [(0, '445.089')]
+[2023-03-09 15:28:05,086][744402] Updated weights for policy 0, policy_version 61440 (0.0005)
+[2023-03-09 15:28:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9219.5). Total num frames: 31494144. Throughput: 0: 9190.8. Samples: 31473728. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:08,996][744089] Avg episode reward: [(0, '408.646')]
+[2023-03-09 15:28:09,374][744402] Updated weights for policy 0, policy_version 61520 (0.0004)
+[2023-03-09 15:28:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9191.7). Total num frames: 31535104. Throughput: 0: 9149.5. Samples: 31528540. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:13,995][744089] Avg episode reward: [(0, '312.144')]
+[2023-03-09 15:28:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000061600_31539200.pth...
+[2023-03-09 15:28:13,999][744402] Updated weights for policy 0, policy_version 61600 (0.0005)
+[2023-03-09 15:28:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000061056_31260672.pth
+[2023-03-09 15:28:18,797][744402] Updated weights for policy 0, policy_version 61680 (0.0005)
+[2023-03-09 15:28:18,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 31580160. Throughput: 0: 9116.6. Samples: 31580224. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:18,995][744089] Avg episode reward: [(0, '418.254')]
+[2023-03-09 15:28:23,273][744402] Updated weights for policy 0, policy_version 61760 (0.0005)
+[2023-03-09 15:28:23,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 31625216. Throughput: 0: 9132.0. Samples: 31607976. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:23,995][744089] Avg episode reward: [(0, '430.367')]
+[2023-03-09 15:28:27,756][744402] Updated weights for policy 0, policy_version 61840 (0.0005)
+[2023-03-09 15:28:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 31674368. Throughput: 0: 9089.1. Samples: 31662252. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:28,995][744089] Avg episode reward: [(0, '419.653')]
+[2023-03-09 15:28:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000061864_31674368.pth...
+[2023-03-09 15:28:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000061328_31399936.pth
+[2023-03-09 15:28:32,125][744402] Updated weights for policy 0, policy_version 61920 (0.0005)
+[2023-03-09 15:28:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 31719424. Throughput: 0: 9166.6. Samples: 31719488. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:33,995][744089] Avg episode reward: [(0, '393.401')]
+[2023-03-09 15:28:36,479][744402] Updated weights for policy 0, policy_version 62000 (0.0005)
+[2023-03-09 15:28:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 31764480. Throughput: 0: 9177.8. Samples: 31747384. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:38,996][744089] Avg episode reward: [(0, '448.181')]
+[2023-03-09 15:28:41,010][744402] Updated weights for policy 0, policy_version 62080 (0.0005)
+[2023-03-09 15:28:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 31809536. Throughput: 0: 9096.1. Samples: 31800308. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:43,995][744089] Avg episode reward: [(0, '446.619')]
+[2023-03-09 15:28:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000062128_31809536.pth...
+[2023-03-09 15:28:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000061600_31539200.pth
+[2023-03-09 15:28:45,920][744402] Updated weights for policy 0, policy_version 62160 (0.0004)
+[2023-03-09 15:28:48,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 31850496. Throughput: 0: 9028.4. Samples: 31851344. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:48,995][744089] Avg episode reward: [(0, '438.722')]
+[2023-03-09 15:28:50,562][744402] Updated weights for policy 0, policy_version 62240 (0.0005)
+[2023-03-09 15:28:53,995][744089] Fps is (10 sec: 8601.5, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 31895552. Throughput: 0: 8960.7. Samples: 31876960. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:53,996][744089] Avg episode reward: [(0, '473.049')]
+[2023-03-09 15:28:55,149][744402] Updated weights for policy 0, policy_version 62320 (0.0005)
+[2023-03-09 15:28:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 31940608. Throughput: 0: 8967.8. Samples: 31932092. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:28:58,996][744089] Avg episode reward: [(0, '468.569')]
+[2023-03-09 15:28:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000062384_31940608.pth...
+[2023-03-09 15:28:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000061864_31674368.pth
+[2023-03-09 15:28:59,917][744402] Updated weights for policy 0, policy_version 62400 (0.0005)
+[2023-03-09 15:29:03,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 31981568. Throughput: 0: 8981.8. Samples: 31984404. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:29:03,995][744089] Avg episode reward: [(0, '440.020')]
+[2023-03-09 15:29:04,545][744402] Updated weights for policy 0, policy_version 62480 (0.0005)
+[2023-03-09 15:29:08,914][744402] Updated weights for policy 0, policy_version 62560 (0.0005)
+[2023-03-09 15:29:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9094.5). Total num frames: 32030720. Throughput: 0: 8956.5. Samples: 32011020. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:29:08,995][744089] Avg episode reward: [(0, '475.285')]
+[2023-03-09 15:29:13,096][744402] Updated weights for policy 0, policy_version 62640 (0.0005)
+[2023-03-09 15:29:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 32079872. Throughput: 0: 9048.8. Samples: 32069448. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:29:13,995][744089] Avg episode reward: [(0, '467.334')]
+[2023-03-09 15:29:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000062656_32079872.pth...
+[2023-03-09 15:29:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000062128_31809536.pth
+[2023-03-09 15:29:17,343][744402] Updated weights for policy 0, policy_version 62720 (0.0004)
+[2023-03-09 15:29:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 32124928. Throughput: 0: 9062.2. Samples: 32127288. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:18,995][744089] Avg episode reward: [(0, '486.060')]
+[2023-03-09 15:29:21,972][744402] Updated weights for policy 0, policy_version 62800 (0.0005)
+[2023-03-09 15:29:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 32169984. Throughput: 0: 9023.6. Samples: 32153444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:23,996][744089] Avg episode reward: [(0, '488.814')]
+[2023-03-09 15:29:26,765][744402] Updated weights for policy 0, policy_version 62880 (0.0004)
+[2023-03-09 15:29:28,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8942.9, 300 sec: 9094.5). Total num frames: 32210944. Throughput: 0: 8955.4. Samples: 32203304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:28,996][744089] Avg episode reward: [(0, '473.927')]
+[2023-03-09 15:29:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000062912_32210944.pth...
+[2023-03-09 15:29:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000062384_31940608.pth
+[2023-03-09 15:29:31,412][744402] Updated weights for policy 0, policy_version 62960 (0.0005)
+[2023-03-09 15:29:33,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9094.5). Total num frames: 32256000. Throughput: 0: 9032.5. Samples: 32257808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:33,995][744089] Avg episode reward: [(0, '453.867')]
+[2023-03-09 15:29:35,910][744402] Updated weights for policy 0, policy_version 63040 (0.0005)
+[2023-03-09 15:29:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 32305152. Throughput: 0: 9078.9. Samples: 32285508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:38,995][744089] Avg episode reward: [(0, '444.828')]
+[2023-03-09 15:29:40,337][744402] Updated weights for policy 0, policy_version 63120 (0.0005)
+[2023-03-09 15:29:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9094.5). Total num frames: 32346112. Throughput: 0: 9030.7. Samples: 32338472. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:43,995][744089] Avg episode reward: [(0, '392.841')]
+[2023-03-09 15:29:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000063176_32346112.pth...
+[2023-03-09 15:29:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000062656_32079872.pth
+[2023-03-09 15:29:44,888][744402] Updated weights for policy 0, policy_version 63200 (0.0005)
+[2023-03-09 15:29:48,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 32395264. Throughput: 0: 9126.5. Samples: 32395096. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:48,996][744089] Avg episode reward: [(0, '380.215')]
+[2023-03-09 15:29:49,346][744402] Updated weights for policy 0, policy_version 63280 (0.0005)
+[2023-03-09 15:29:53,977][744402] Updated weights for policy 0, policy_version 63360 (0.0005)
+[2023-03-09 15:29:53,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 32440320. Throughput: 0: 9086.5. Samples: 32419912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:53,996][744089] Avg episode reward: [(0, '368.514')]
+[2023-03-09 15:29:58,523][744402] Updated weights for policy 0, policy_version 63440 (0.0005)
+[2023-03-09 15:29:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 32485376. Throughput: 0: 9033.6. Samples: 32475960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:29:58,996][744089] Avg episode reward: [(0, '368.693')]
+[2023-03-09 15:29:59,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000063448_32485376.pth...
+[2023-03-09 15:29:59,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000062912_32210944.pth
+[2023-03-09 15:30:02,975][744402] Updated weights for policy 0, policy_version 63520 (0.0005)
+[2023-03-09 15:30:03,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 32526336. Throughput: 0: 8941.7. Samples: 32529664. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:30:03,995][744089] Avg episode reward: [(0, '356.665')]
+[2023-03-09 15:30:07,607][744402] Updated weights for policy 0, policy_version 63600 (0.0006)
+[2023-03-09 15:30:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 32575488. Throughput: 0: 8929.4. Samples: 32555268. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:30:08,995][744089] Avg episode reward: [(0, '436.643')]
+[2023-03-09 15:30:11,972][744402] Updated weights for policy 0, policy_version 63680 (0.0005)
+[2023-03-09 15:30:13,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 32620544. Throughput: 0: 9078.7. Samples: 32611848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:30:14,006][744089] Avg episode reward: [(0, '403.229')]
+[2023-03-09 15:30:14,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000063712_32620544.pth...
+[2023-03-09 15:30:14,011][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000063176_32346112.pth
+[2023-03-09 15:30:16,687][744402] Updated weights for policy 0, policy_version 63760 (0.0004)
+[2023-03-09 15:30:18,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9080.6). Total num frames: 32661504. Throughput: 0: 9016.5. Samples: 32663552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:30:18,995][744089] Avg episode reward: [(0, '445.447')]
+[2023-03-09 15:30:21,486][744402] Updated weights for policy 0, policy_version 63840 (0.0005)
+[2023-03-09 15:30:23,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9080.6). Total num frames: 32706560. Throughput: 0: 8986.8. Samples: 32689912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:30:23,995][744089] Avg episode reward: [(0, '369.026')]
+[2023-03-09 15:30:25,855][744402] Updated weights for policy 0, policy_version 63920 (0.0005)
+[2023-03-09 15:30:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 32755712. Throughput: 0: 9049.0. Samples: 32745680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:30:28,996][744089] Avg episode reward: [(0, '442.213')]
+[2023-03-09 15:30:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000063976_32755712.pth...
+[2023-03-09 15:30:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000063448_32485376.pth
+[2023-03-09 15:30:30,164][744402] Updated weights for policy 0, policy_version 64000 (0.0005)
+[2023-03-09 15:30:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 32800768. Throughput: 0: 9006.1. Samples: 32800368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:30:33,995][744089] Avg episode reward: [(0, '462.743')]
+[2023-03-09 15:30:34,761][744402] Updated weights for policy 0, policy_version 64080 (0.0005)
+[2023-03-09 15:30:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 32845824. Throughput: 0: 9075.2. Samples: 32828296. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:30:38,995][744089] Avg episode reward: [(0, '403.679')]
+[2023-03-09 15:30:39,237][744402] Updated weights for policy 0, policy_version 64160 (0.0004)
+[2023-03-09 15:30:43,725][744402] Updated weights for policy 0, policy_version 64240 (0.0004)
+[2023-03-09 15:30:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.4, 300 sec: 9080.6). Total num frames: 32890880. Throughput: 0: 9039.8. Samples: 32882752. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:30:43,996][744089] Avg episode reward: [(0, '469.706')]
+[2023-03-09 15:30:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000064240_32890880.pth...
+[2023-03-09 15:30:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000063712_32620544.pth
+[2023-03-09 15:30:48,286][744402] Updated weights for policy 0, policy_version 64320 (0.0005)
+[2023-03-09 15:30:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 32935936. Throughput: 0: 9061.1. Samples: 32937412. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:30:48,995][744089] Avg episode reward: [(0, '461.871')]
+[2023-03-09 15:30:52,493][744402] Updated weights for policy 0, policy_version 64400 (0.0004)
+[2023-03-09 15:30:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 32985088. Throughput: 0: 9122.5. Samples: 32965780. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:30:53,995][744089] Avg episode reward: [(0, '501.306')]
+[2023-03-09 15:30:57,184][744402] Updated weights for policy 0, policy_version 64480 (0.0005)
+[2023-03-09 15:30:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 33030144. Throughput: 0: 9066.1. Samples: 33019824. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:30:58,996][744089] Avg episode reward: [(0, '486.175')]
+[2023-03-09 15:30:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000064512_33030144.pth...
+[2023-03-09 15:30:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000063976_32755712.pth
+[2023-03-09 15:31:01,480][744402] Updated weights for policy 0, policy_version 64560 (0.0006)
+[2023-03-09 15:31:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9094.5). Total num frames: 33075200. Throughput: 0: 9149.1. Samples: 33075264. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:31:03,996][744089] Avg episode reward: [(0, '465.281')]
+[2023-03-09 15:31:06,022][744402] Updated weights for policy 0, policy_version 64640 (0.0005)
+[2023-03-09 15:31:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9080.6). Total num frames: 33120256. Throughput: 0: 9185.2. Samples: 33103248. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:31:08,996][744089] Avg episode reward: [(0, '466.420')]
+[2023-03-09 15:31:10,460][744402] Updated weights for policy 0, policy_version 64720 (0.0005)
+[2023-03-09 15:31:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9080.6). Total num frames: 33165312. Throughput: 0: 9172.8. Samples: 33158456. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:31:13,995][744089] Avg episode reward: [(0, '460.659')]
+[2023-03-09 15:31:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000064776_33165312.pth...
+[2023-03-09 15:31:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000064240_32890880.pth
+[2023-03-09 15:31:15,003][744402] Updated weights for policy 0, policy_version 64800 (0.0005)
+[2023-03-09 15:31:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 33214464. Throughput: 0: 9160.6. Samples: 33212596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:18,995][744089] Avg episode reward: [(0, '448.394')]
+[2023-03-09 15:31:19,434][744402] Updated weights for policy 0, policy_version 64880 (0.0006)
+[2023-03-09 15:31:23,892][744402] Updated weights for policy 0, policy_version 64960 (0.0005)
+[2023-03-09 15:31:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 33259520. Throughput: 0: 9150.4. Samples: 33240064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:23,995][744089] Avg episode reward: [(0, '457.602')]
+[2023-03-09 15:31:28,403][744402] Updated weights for policy 0, policy_version 65040 (0.0005)
+[2023-03-09 15:31:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 33304576. Throughput: 0: 9158.7. Samples: 33294892. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:28,995][744089] Avg episode reward: [(0, '472.077')]
+[2023-03-09 15:31:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000065048_33304576.pth...
+[2023-03-09 15:31:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000064512_33030144.pth
+[2023-03-09 15:31:32,887][744402] Updated weights for policy 0, policy_version 65120 (0.0005)
+[2023-03-09 15:31:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 33349632. Throughput: 0: 9160.6. Samples: 33349640. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:33,995][744089] Avg episode reward: [(0, '504.623')]
+[2023-03-09 15:31:37,516][744402] Updated weights for policy 0, policy_version 65200 (0.0005)
+[2023-03-09 15:31:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 33394688. Throughput: 0: 9115.7. Samples: 33375984. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:38,995][744089] Avg episode reward: [(0, '489.200')]
+[2023-03-09 15:31:42,064][744402] Updated weights for policy 0, policy_version 65280 (0.0005)
+[2023-03-09 15:31:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 33439744. Throughput: 0: 9108.9. Samples: 33429724. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:43,996][744089] Avg episode reward: [(0, '460.612')]
+[2023-03-09 15:31:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000065312_33439744.pth...
+[2023-03-09 15:31:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000064776_33165312.pth
+[2023-03-09 15:31:46,543][744402] Updated weights for policy 0, policy_version 65360 (0.0005)
+[2023-03-09 15:31:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 33484800. Throughput: 0: 9112.5. Samples: 33485324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:48,995][744089] Avg episode reward: [(0, '495.513')]
+[2023-03-09 15:31:51,071][744402] Updated weights for policy 0, policy_version 65440 (0.0005)
+[2023-03-09 15:31:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9080.6). Total num frames: 33529856. Throughput: 0: 9110.3. Samples: 33513212. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:53,995][744089] Avg episode reward: [(0, '494.111')]
+[2023-03-09 15:31:55,654][744402] Updated weights for policy 0, policy_version 65520 (0.0005)
+[2023-03-09 15:31:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 33574912. Throughput: 0: 9071.5. Samples: 33566672. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:31:58,995][744089] Avg episode reward: [(0, '442.034')]
+[2023-03-09 15:31:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000065576_33574912.pth...
+[2023-03-09 15:31:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000065048_33304576.pth
+[2023-03-09 15:32:00,003][744402] Updated weights for policy 0, policy_version 65600 (0.0005)
+[2023-03-09 15:32:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 33624064. Throughput: 0: 9142.8. Samples: 33624020. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:03,995][744089] Avg episode reward: [(0, '503.836')]
+[2023-03-09 15:32:04,272][744402] Updated weights for policy 0, policy_version 65680 (0.0005)
+[2023-03-09 15:32:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 33665024. Throughput: 0: 9107.6. Samples: 33649908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:08,995][744089] Avg episode reward: [(0, '489.735')]
+[2023-03-09 15:32:09,078][744402] Updated weights for policy 0, policy_version 65760 (0.0005)
+[2023-03-09 15:32:13,729][744402] Updated weights for policy 0, policy_version 65840 (0.0005)
+[2023-03-09 15:32:13,995][744089] Fps is (10 sec: 8601.5, 60 sec: 9079.5, 300 sec: 9080.6). Total num frames: 33710080. Throughput: 0: 9044.0. Samples: 33701872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:13,996][744089] Avg episode reward: [(0, '504.355')]
+[2023-03-09 15:32:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000065840_33710080.pth...
+[2023-03-09 15:32:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000065312_33439744.pth
+[2023-03-09 15:32:18,276][744402] Updated weights for policy 0, policy_version 65920 (0.0005)
+[2023-03-09 15:32:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 33755136. Throughput: 0: 9013.2. Samples: 33755236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:18,995][744089] Avg episode reward: [(0, '499.611')]
+[2023-03-09 15:32:22,796][744402] Updated weights for policy 0, policy_version 66000 (0.0005)
+[2023-03-09 15:32:23,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 33800192. Throughput: 0: 9023.7. Samples: 33782052. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:23,995][744089] Avg episode reward: [(0, '496.337')]
+[2023-03-09 15:32:27,265][744402] Updated weights for policy 0, policy_version 66080 (0.0005)
+[2023-03-09 15:32:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 33845248. Throughput: 0: 9063.8. Samples: 33837596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:28,996][744089] Avg episode reward: [(0, '458.243')]
+[2023-03-09 15:32:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000066104_33845248.pth...
+[2023-03-09 15:32:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000065576_33574912.pth
+[2023-03-09 15:32:31,749][744402] Updated weights for policy 0, policy_version 66160 (0.0005)
+[2023-03-09 15:32:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9080.6). Total num frames: 33894400. Throughput: 0: 9104.7. Samples: 33895036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:33,995][744089] Avg episode reward: [(0, '487.069')]
+[2023-03-09 15:32:35,816][744402] Updated weights for policy 0, policy_version 66240 (0.0005)
+[2023-03-09 15:32:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9080.6). Total num frames: 33939456. Throughput: 0: 9110.2. Samples: 33923172. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:38,995][744089] Avg episode reward: [(0, '471.959')]
+[2023-03-09 15:32:40,373][744402] Updated weights for policy 0, policy_version 66320 (0.0005)
+[2023-03-09 15:32:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9094.5). Total num frames: 33988608. Throughput: 0: 9162.4. Samples: 33978980. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:43,996][744089] Avg episode reward: [(0, '487.768')]
+[2023-03-09 15:32:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000066384_33988608.pth...
+[2023-03-09 15:32:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000065840_33710080.pth
+[2023-03-09 15:32:44,806][744402] Updated weights for policy 0, policy_version 66400 (0.0005)
+[2023-03-09 15:32:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9094.5). Total num frames: 34033664. Throughput: 0: 9079.5. Samples: 34032600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:48,996][744089] Avg episode reward: [(0, '500.078')]
+[2023-03-09 15:32:49,396][744402] Updated weights for policy 0, policy_version 66480 (0.0005)
+[2023-03-09 15:32:53,934][744402] Updated weights for policy 0, policy_version 66560 (0.0005)
+[2023-03-09 15:32:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 34078720. Throughput: 0: 9117.8. Samples: 34060208. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:53,995][744089] Avg episode reward: [(0, '511.765')]
+[2023-03-09 15:32:58,296][744402] Updated weights for policy 0, policy_version 66640 (0.0005)
+[2023-03-09 15:32:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 34123776. Throughput: 0: 9195.0. Samples: 34115648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:32:58,996][744089] Avg episode reward: [(0, '507.354')]
+[2023-03-09 15:32:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000066648_34123776.pth...
+[2023-03-09 15:32:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000066104_33845248.pth
+[2023-03-09 15:33:02,839][744402] Updated weights for policy 0, policy_version 66720 (0.0005)
+[2023-03-09 15:33:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 34168832. Throughput: 0: 9230.5. Samples: 34170608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:33:03,995][744089] Avg episode reward: [(0, '504.944')]
+[2023-03-09 15:33:07,432][744402] Updated weights for policy 0, policy_version 66800 (0.0005)
+[2023-03-09 15:33:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.8, 300 sec: 9080.6). Total num frames: 34213888. Throughput: 0: 9214.5. Samples: 34196704. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:33:08,995][744089] Avg episode reward: [(0, '456.441')]
+[2023-03-09 15:33:11,876][744402] Updated weights for policy 0, policy_version 66880 (0.0006)
+[2023-03-09 15:33:13,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 34258944. Throughput: 0: 9195.5. Samples: 34251392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:33:13,996][744089] Avg episode reward: [(0, '438.859')]
+[2023-03-09 15:33:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000066912_34258944.pth...
+[2023-03-09 15:33:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000066384_33988608.pth
+[2023-03-09 15:33:16,394][744402] Updated weights for policy 0, policy_version 66960 (0.0005)
+[2023-03-09 15:33:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 34304000. Throughput: 0: 9129.4. Samples: 34305860. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:33:18,995][744089] Avg episode reward: [(0, '496.740')]
+[2023-03-09 15:33:20,871][744402] Updated weights for policy 0, policy_version 67040 (0.0005)
+[2023-03-09 15:33:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 34349056. Throughput: 0: 9101.4. Samples: 34332736. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:33:23,995][744089] Avg episode reward: [(0, '444.523')]
+[2023-03-09 15:33:25,495][744402] Updated weights for policy 0, policy_version 67120 (0.0005)
+[2023-03-09 15:33:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 34394112. Throughput: 0: 9049.2. Samples: 34386196. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:33:28,996][744089] Avg episode reward: [(0, '469.593')]
+[2023-03-09 15:33:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000067176_34394112.pth...
+[2023-03-09 15:33:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000066648_34123776.pth
+[2023-03-09 15:33:30,076][744402] Updated weights for policy 0, policy_version 67200 (0.0005)
+[2023-03-09 15:33:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 34439168. Throughput: 0: 9036.4. Samples: 34439240. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:33:33,995][744089] Avg episode reward: [(0, '485.994')]
+[2023-03-09 15:33:34,549][744402] Updated weights for policy 0, policy_version 67280 (0.0005)
+[2023-03-09 15:33:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 34484224. Throughput: 0: 9057.6. Samples: 34467800. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:33:38,995][744089] Avg episode reward: [(0, '494.655')]
+[2023-03-09 15:33:39,127][744402] Updated weights for policy 0, policy_version 67360 (0.0005)
+[2023-03-09 15:33:43,475][744402] Updated weights for policy 0, policy_version 67440 (0.0005)
+[2023-03-09 15:33:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 34533376. Throughput: 0: 9070.7. Samples: 34523828. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:33:43,996][744089] Avg episode reward: [(0, '468.835')]
+[2023-03-09 15:33:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000067448_34533376.pth...
+[2023-03-09 15:33:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000066912_34258944.pth
+[2023-03-09 15:33:47,722][744402] Updated weights for policy 0, policy_version 67520 (0.0005)
+[2023-03-09 15:33:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 34578432. Throughput: 0: 9128.5. Samples: 34581392. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:33:48,995][744089] Avg episode reward: [(0, '466.665')]
+[2023-03-09 15:33:51,849][744402] Updated weights for policy 0, policy_version 67600 (0.0005)
+[2023-03-09 15:33:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 34627584. Throughput: 0: 9210.2. Samples: 34611164. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:33:53,995][744089] Avg episode reward: [(0, '327.106')]
+[2023-03-09 15:33:56,467][744402] Updated weights for policy 0, policy_version 67680 (0.0005)
+[2023-03-09 15:33:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 34672640. Throughput: 0: 9177.4. Samples: 34664376. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:33:58,995][744089] Avg episode reward: [(0, '395.569')]
+[2023-03-09 15:33:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000067720_34672640.pth...
+[2023-03-09 15:33:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000067176_34394112.pth
+[2023-03-09 15:34:00,876][744402] Updated weights for policy 0, policy_version 67760 (0.0005)
+[2023-03-09 15:34:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 34721792. Throughput: 0: 9216.8. Samples: 34720616. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:34:03,995][744089] Avg episode reward: [(0, '447.120')]
+[2023-03-09 15:34:05,169][744402] Updated weights for policy 0, policy_version 67840 (0.0005)
+[2023-03-09 15:34:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9094.5). Total num frames: 34762752. Throughput: 0: 9270.0. Samples: 34749884. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:34:08,995][744089] Avg episode reward: [(0, '440.224')]
+[2023-03-09 15:34:09,932][744402] Updated weights for policy 0, policy_version 67920 (0.0005)
+[2023-03-09 15:34:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 34811904. Throughput: 0: 9245.9. Samples: 34802260. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:34:13,995][744089] Avg episode reward: [(0, '478.204')]
+[2023-03-09 15:34:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000067992_34811904.pth...
+[2023-03-09 15:34:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000067448_34533376.pth
+[2023-03-09 15:34:14,150][744402] Updated weights for policy 0, policy_version 68000 (0.0005)
+[2023-03-09 15:34:18,457][744402] Updated weights for policy 0, policy_version 68080 (0.0005)
+[2023-03-09 15:34:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9284.2, 300 sec: 9122.3). Total num frames: 34861056. Throughput: 0: 9361.9. Samples: 34860528. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:34:18,996][744089] Avg episode reward: [(0, '493.712')]
+[2023-03-09 15:34:22,972][744402] Updated weights for policy 0, policy_version 68160 (0.0005)
+[2023-03-09 15:34:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 34906112. Throughput: 0: 9315.3. Samples: 34886988. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:34:23,995][744089] Avg episode reward: [(0, '335.321')]
+[2023-03-09 15:34:27,490][744402] Updated weights for policy 0, policy_version 68240 (0.0004)
+[2023-03-09 15:34:28,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 34951168. Throughput: 0: 9302.2. Samples: 34942428. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:34:28,995][744089] Avg episode reward: [(0, '402.840')]
+[2023-03-09 15:34:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000068264_34951168.pth...
+[2023-03-09 15:34:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000067720_34672640.pth
+[2023-03-09 15:34:31,880][744402] Updated weights for policy 0, policy_version 68320 (0.0005)
+[2023-03-09 15:34:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9122.3). Total num frames: 34996224. Throughput: 0: 9219.9. Samples: 34996288. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:34:33,995][744089] Avg episode reward: [(0, '464.527')]
+[2023-03-09 15:34:36,353][744402] Updated weights for policy 0, policy_version 68400 (0.0004)
+[2023-03-09 15:34:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 35041280. Throughput: 0: 9194.3. Samples: 35024908. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 15:34:38,995][744089] Avg episode reward: [(0, '478.719')]
+[2023-03-09 15:34:41,035][744402] Updated weights for policy 0, policy_version 68480 (0.0005)
+[2023-03-09 15:34:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 35090432. Throughput: 0: 9209.7. Samples: 35078812. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:34:43,996][744089] Avg episode reward: [(0, '460.781')]
+[2023-03-09 15:34:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000068536_35090432.pth...
+[2023-03-09 15:34:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000067992_34811904.pth
+[2023-03-09 15:34:45,109][744402] Updated weights for policy 0, policy_version 68560 (0.0005)
+[2023-03-09 15:34:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 35135488. Throughput: 0: 9240.6. Samples: 35136444. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:34:48,995][744089] Avg episode reward: [(0, '482.211')]
+[2023-03-09 15:34:49,567][744402] Updated weights for policy 0, policy_version 68640 (0.0005)
+[2023-03-09 15:34:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 35180544. Throughput: 0: 9235.4. Samples: 35165476. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:34:53,995][744089] Avg episode reward: [(0, '495.800')]
+[2023-03-09 15:34:53,996][744402] Updated weights for policy 0, policy_version 68720 (0.0005)
+[2023-03-09 15:34:58,552][744402] Updated weights for policy 0, policy_version 68800 (0.0005)
+[2023-03-09 15:34:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9163.9). Total num frames: 35229696. Throughput: 0: 9247.7. Samples: 35218408. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:34:58,996][744089] Avg episode reward: [(0, '435.152')]
+[2023-03-09 15:34:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000068808_35229696.pth...
+[2023-03-09 15:34:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000068264_34951168.pth
+[2023-03-09 15:35:02,828][744402] Updated weights for policy 0, policy_version 68880 (0.0005)
+[2023-03-09 15:35:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 35274752. Throughput: 0: 9205.0. Samples: 35274752. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:35:03,995][744089] Avg episode reward: [(0, '460.396')]
+[2023-03-09 15:35:07,540][744402] Updated weights for policy 0, policy_version 68960 (0.0005)
+[2023-03-09 15:35:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9150.1). Total num frames: 35319808. Throughput: 0: 9188.6. Samples: 35300476. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:35:08,995][744089] Avg episode reward: [(0, '480.965')]
+[2023-03-09 15:35:11,596][744402] Updated weights for policy 0, policy_version 69040 (0.0005)
+[2023-03-09 15:35:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9177.8). Total num frames: 35368960. Throughput: 0: 9268.5. Samples: 35359512. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:35:13,996][744089] Avg episode reward: [(0, '487.141')]
+[2023-03-09 15:35:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000069080_35368960.pth...
+[2023-03-09 15:35:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000068536_35090432.pth
+[2023-03-09 15:35:16,036][744402] Updated weights for policy 0, policy_version 69120 (0.0005)
+[2023-03-09 15:35:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 35414016. Throughput: 0: 9285.3. Samples: 35414128. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:35:18,995][744089] Avg episode reward: [(0, '481.063')]
+[2023-03-09 15:35:20,511][744402] Updated weights for policy 0, policy_version 69200 (0.0005)
+[2023-03-09 15:35:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 35459072. Throughput: 0: 9282.2. Samples: 35442608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:35:23,995][744089] Avg episode reward: [(0, '387.859')]
+[2023-03-09 15:35:25,098][744402] Updated weights for policy 0, policy_version 69280 (0.0005)
+[2023-03-09 15:35:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 35504128. Throughput: 0: 9243.5. Samples: 35494772. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:35:28,996][744089] Avg episode reward: [(0, '442.203')]
+[2023-03-09 15:35:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000069344_35504128.pth...
+[2023-03-09 15:35:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000068808_35229696.pth
+[2023-03-09 15:35:29,888][744402] Updated weights for policy 0, policy_version 69360 (0.0006)
+[2023-03-09 15:35:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 35549184. Throughput: 0: 9173.4. Samples: 35549248. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:35:33,996][744089] Avg episode reward: [(0, '423.480')]
+[2023-03-09 15:35:34,256][744402] Updated weights for policy 0, policy_version 69440 (0.0005)
+[2023-03-09 15:35:38,608][744402] Updated weights for policy 0, policy_version 69520 (0.0005)
+[2023-03-09 15:35:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 35594240. Throughput: 0: 9159.4. Samples: 35577648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:35:38,996][744089] Avg episode reward: [(0, '488.490')]
+[2023-03-09 15:35:43,033][744402] Updated weights for policy 0, policy_version 69600 (0.0005)
+[2023-03-09 15:35:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 35639296. Throughput: 0: 9216.3. Samples: 35633140. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:35:43,996][744089] Avg episode reward: [(0, '496.598')]
+[2023-03-09 15:35:44,006][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000069616_35643392.pth...
+[2023-03-09 15:35:44,007][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000069080_35368960.pth
+[2023-03-09 15:35:47,644][744402] Updated weights for policy 0, policy_version 69680 (0.0005)
+[2023-03-09 15:35:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9150.0). Total num frames: 35684352. Throughput: 0: 9168.4. Samples: 35687328. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:35:48,995][744089] Avg episode reward: [(0, '485.103')]
+[2023-03-09 15:35:52,296][744402] Updated weights for policy 0, policy_version 69760 (0.0005)
+[2023-03-09 15:35:53,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9147.8, 300 sec: 9150.1). Total num frames: 35729408. Throughput: 0: 9164.6. Samples: 35712880. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:35:53,995][744089] Avg episode reward: [(0, '492.571')]
+[2023-03-09 15:35:57,093][744402] Updated weights for policy 0, policy_version 69840 (0.0005)
+[2023-03-09 15:35:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 35774464. Throughput: 0: 8995.3. Samples: 35764300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:35:58,996][744089] Avg episode reward: [(0, '370.248')]
+[2023-03-09 15:35:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000069872_35774464.pth...
+[2023-03-09 15:35:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000069344_35504128.pth
+[2023-03-09 15:36:01,605][744402] Updated weights for policy 0, policy_version 69920 (0.0005)
+[2023-03-09 15:36:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 35819520. Throughput: 0: 9010.1. Samples: 35819584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:03,995][744089] Avg episode reward: [(0, '443.993')]
+[2023-03-09 15:36:06,194][744402] Updated weights for policy 0, policy_version 70000 (0.0005)
+[2023-03-09 15:36:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 35864576. Throughput: 0: 8942.5. Samples: 35845020. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:08,995][744089] Avg episode reward: [(0, '508.058')]
+[2023-03-09 15:36:10,588][744402] Updated weights for policy 0, policy_version 70080 (0.0005)
+[2023-03-09 15:36:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 35909632. Throughput: 0: 9088.4. Samples: 35903752. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:13,995][744089] Avg episode reward: [(0, '486.602')]
+[2023-03-09 15:36:14,020][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000070144_35913728.pth...
+[2023-03-09 15:36:14,022][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000069616_35643392.pth
+[2023-03-09 15:36:14,896][744402] Updated weights for policy 0, policy_version 70160 (0.0005)
+[2023-03-09 15:36:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 35954688. Throughput: 0: 9050.1. Samples: 35956500. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:18,995][744089] Avg episode reward: [(0, '453.292')]
+[2023-03-09 15:36:19,494][744402] Updated weights for policy 0, policy_version 70240 (0.0005)
+[2023-03-09 15:36:23,772][744402] Updated weights for policy 0, policy_version 70320 (0.0004)
+[2023-03-09 15:36:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 36003840. Throughput: 0: 9028.0. Samples: 35983908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:23,995][744089] Avg episode reward: [(0, '442.005')]
+[2023-03-09 15:36:28,107][744402] Updated weights for policy 0, policy_version 70400 (0.0005)
+[2023-03-09 15:36:28,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 36048896. Throughput: 0: 9099.1. Samples: 36042596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:28,995][744089] Avg episode reward: [(0, '434.902')]
+[2023-03-09 15:36:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000070408_36048896.pth...
+[2023-03-09 15:36:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000069872_35774464.pth
+[2023-03-09 15:36:32,684][744402] Updated weights for policy 0, policy_version 70480 (0.0005)
+[2023-03-09 15:36:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 36098048. Throughput: 0: 9111.3. Samples: 36097336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:33,995][744089] Avg episode reward: [(0, '484.955')]
+[2023-03-09 15:36:37,148][744402] Updated weights for policy 0, policy_version 70560 (0.0004)
+[2023-03-09 15:36:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 36143104. Throughput: 0: 9111.1. Samples: 36122880. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:38,995][744089] Avg episode reward: [(0, '502.386')]
+[2023-03-09 15:36:41,535][744402] Updated weights for policy 0, policy_version 70640 (0.0005)
+[2023-03-09 15:36:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.8, 300 sec: 9163.9). Total num frames: 36188160. Throughput: 0: 9244.2. Samples: 36180288. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:43,995][744089] Avg episode reward: [(0, '506.801')]
+[2023-03-09 15:36:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000070680_36188160.pth...
+[2023-03-09 15:36:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000070144_35913728.pth
+[2023-03-09 15:36:46,053][744402] Updated weights for policy 0, policy_version 70720 (0.0005)
+[2023-03-09 15:36:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 36237312. Throughput: 0: 9247.7. Samples: 36235732. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:48,995][744089] Avg episode reward: [(0, '496.962')]
+[2023-03-09 15:36:50,358][744402] Updated weights for policy 0, policy_version 70800 (0.0005)
+[2023-03-09 15:36:53,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 36282368. Throughput: 0: 9265.8. Samples: 36261980. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:53,995][744089] Avg episode reward: [(0, '467.462')]
+[2023-03-09 15:36:54,861][744402] Updated weights for policy 0, policy_version 70880 (0.0005)
+[2023-03-09 15:36:58,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9147.8, 300 sec: 9150.0). Total num frames: 36323328. Throughput: 0: 9171.5. Samples: 36316468. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:36:58,995][744089] Avg episode reward: [(0, '503.134')]
+[2023-03-09 15:36:59,033][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000070952_36327424.pth...
+[2023-03-09 15:36:59,035][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000070408_36048896.pth
+[2023-03-09 15:36:59,500][744402] Updated weights for policy 0, policy_version 70960 (0.0005)
+[2023-03-09 15:37:03,953][744402] Updated weights for policy 0, policy_version 71040 (0.0005)
+[2023-03-09 15:37:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 36372480. Throughput: 0: 9211.9. Samples: 36371036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:37:03,995][744089] Avg episode reward: [(0, '494.304')]
+[2023-03-09 15:37:08,784][744402] Updated weights for policy 0, policy_version 71120 (0.0005)
+[2023-03-09 15:37:08,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 36413440. Throughput: 0: 9183.5. Samples: 36397164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:37:08,996][744089] Avg episode reward: [(0, '488.493')]
+[2023-03-09 15:37:13,020][744402] Updated weights for policy 0, policy_version 71200 (0.0005)
+[2023-03-09 15:37:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 36462592. Throughput: 0: 9101.8. Samples: 36452176. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:37:14,006][744089] Avg episode reward: [(0, '364.666')]
+[2023-03-09 15:37:14,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000071216_36462592.pth...
+[2023-03-09 15:37:14,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000070680_36188160.pth
+[2023-03-09 15:37:17,498][744402] Updated weights for policy 0, policy_version 71280 (0.0005)
+[2023-03-09 15:37:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 36507648. Throughput: 0: 9117.8. Samples: 36507636. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:37:18,995][744089] Avg episode reward: [(0, '420.503')]
+[2023-03-09 15:37:22,040][744402] Updated weights for policy 0, policy_version 71360 (0.0005)
+[2023-03-09 15:37:23,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9163.9). Total num frames: 36548608. Throughput: 0: 9160.2. Samples: 36535088. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:37:23,995][744089] Avg episode reward: [(0, '474.134')]
+[2023-03-09 15:37:26,853][744402] Updated weights for policy 0, policy_version 71440 (0.0004)
+[2023-03-09 15:37:28,995][744089] Fps is (10 sec: 8601.5, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 36593664. Throughput: 0: 9005.7. Samples: 36585544. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:37:28,996][744089] Avg episode reward: [(0, '364.128')]
+[2023-03-09 15:37:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000071472_36593664.pth...
+[2023-03-09 15:37:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000070952_36327424.pth
+[2023-03-09 15:37:31,257][744402] Updated weights for policy 0, policy_version 71520 (0.0005)
+[2023-03-09 15:37:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9150.0). Total num frames: 36638720. Throughput: 0: 9003.0. Samples: 36640868. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:37:33,995][744089] Avg episode reward: [(0, '465.987')]
+[2023-03-09 15:37:35,827][744402] Updated weights for policy 0, policy_version 71600 (0.0005)
+[2023-03-09 15:37:38,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 36683776. Throughput: 0: 9011.0. Samples: 36667472. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:37:38,995][744089] Avg episode reward: [(0, '358.285')]
+[2023-03-09 15:37:40,529][744402] Updated weights for policy 0, policy_version 71680 (0.0005)
+[2023-03-09 15:37:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 36728832. Throughput: 0: 8981.3. Samples: 36720628. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:37:43,995][744089] Avg episode reward: [(0, '444.428')]
+[2023-03-09 15:37:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000071736_36728832.pth...
+[2023-03-09 15:37:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000071216_36462592.pth
+[2023-03-09 15:37:45,071][744402] Updated weights for policy 0, policy_version 71760 (0.0004)
+[2023-03-09 15:37:48,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 9136.2). Total num frames: 36773888. Throughput: 0: 8993.1. Samples: 36775724. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:37:48,995][744089] Avg episode reward: [(0, '470.082')]
+[2023-03-09 15:37:49,605][744402] Updated weights for policy 0, policy_version 71840 (0.0005)
+[2023-03-09 15:37:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9136.2). Total num frames: 36818944. Throughput: 0: 8988.0. Samples: 36801624. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:37:53,995][744089] Avg episode reward: [(0, '477.347')]
+[2023-03-09 15:37:54,242][744402] Updated weights for policy 0, policy_version 71920 (0.0005)
+[2023-03-09 15:37:58,958][744402] Updated weights for policy 0, policy_version 72000 (0.0005)
+[2023-03-09 15:37:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 36864000. Throughput: 0: 8909.2. Samples: 36853088. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:37:58,996][744089] Avg episode reward: [(0, '489.372')]
+[2023-03-09 15:37:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000072000_36864000.pth...
+[2023-03-09 15:37:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000071472_36593664.pth
+[2023-03-09 15:38:03,691][744402] Updated weights for policy 0, policy_version 72080 (0.0006)
+[2023-03-09 15:38:03,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8874.7, 300 sec: 9122.3). Total num frames: 36904960. Throughput: 0: 8848.4. Samples: 36905812. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:38:03,995][744089] Avg episode reward: [(0, '480.023')]
+[2023-03-09 15:38:08,106][744402] Updated weights for policy 0, policy_version 72160 (0.0005)
+[2023-03-09 15:38:08,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8942.9, 300 sec: 9122.3). Total num frames: 36950016. Throughput: 0: 8849.5. Samples: 36933316. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:38:08,995][744089] Avg episode reward: [(0, '482.119')]
+[2023-03-09 15:38:12,546][744402] Updated weights for policy 0, policy_version 72240 (0.0005)
+[2023-03-09 15:38:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 8942.9, 300 sec: 9136.2). Total num frames: 36999168. Throughput: 0: 8983.2. Samples: 36989788. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 15:38:13,995][744089] Avg episode reward: [(0, '488.814')]
+[2023-03-09 15:38:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000072264_36999168.pth...
+[2023-03-09 15:38:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000071736_36728832.pth
+[2023-03-09 15:38:17,122][744402] Updated weights for policy 0, policy_version 72320 (0.0005)
+[2023-03-09 15:38:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8874.7, 300 sec: 9122.3). Total num frames: 37040128. Throughput: 0: 8914.7. Samples: 37042028. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:18,995][744089] Avg episode reward: [(0, '463.278')]
+[2023-03-09 15:38:21,755][744402] Updated weights for policy 0, policy_version 72400 (0.0005)
+[2023-03-09 15:38:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 37089280. Throughput: 0: 8922.8. Samples: 37069000. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:23,995][744089] Avg episode reward: [(0, '465.617')]
+[2023-03-09 15:38:26,167][744402] Updated weights for policy 0, policy_version 72480 (0.0005)
+[2023-03-09 15:38:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 37134336. Throughput: 0: 9006.7. Samples: 37125928. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:28,995][744089] Avg episode reward: [(0, '433.813')]
+[2023-03-09 15:38:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000072528_37134336.pth...
+[2023-03-09 15:38:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000072000_36864000.pth
+[2023-03-09 15:38:30,676][744402] Updated weights for policy 0, policy_version 72560 (0.0005)
+[2023-03-09 15:38:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 37183488. Throughput: 0: 9024.3. Samples: 37181816. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:33,995][744089] Avg episode reward: [(0, '421.963')]
+[2023-03-09 15:38:34,740][744402] Updated weights for policy 0, policy_version 72640 (0.0005)
+[2023-03-09 15:38:38,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.4, 300 sec: 9136.2). Total num frames: 37228544. Throughput: 0: 9041.1. Samples: 37208472. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:38,995][744089] Avg episode reward: [(0, '446.412')]
+[2023-03-09 15:38:39,377][744402] Updated weights for policy 0, policy_version 72720 (0.0005)
+[2023-03-09 15:38:43,819][744402] Updated weights for policy 0, policy_version 72800 (0.0005)
+[2023-03-09 15:38:43,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 37273600. Throughput: 0: 9149.7. Samples: 37264824. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:43,996][744089] Avg episode reward: [(0, '471.314')]
+[2023-03-09 15:38:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000072800_37273600.pth...
+[2023-03-09 15:38:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000072264_36999168.pth
+[2023-03-09 15:38:48,115][744402] Updated weights for policy 0, policy_version 72880 (0.0005)
+[2023-03-09 15:38:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 37318656. Throughput: 0: 9226.2. Samples: 37320992. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:48,995][744089] Avg episode reward: [(0, '454.869')]
+[2023-03-09 15:38:52,403][744402] Updated weights for policy 0, policy_version 72960 (0.0005)
+[2023-03-09 15:38:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 37367808. Throughput: 0: 9250.5. Samples: 37349588. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:53,995][744089] Avg episode reward: [(0, '450.646')]
+[2023-03-09 15:38:56,862][744402] Updated weights for policy 0, policy_version 73040 (0.0005)
+[2023-03-09 15:38:58,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.8, 300 sec: 9122.3). Total num frames: 37412864. Throughput: 0: 9221.1. Samples: 37404736. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:38:58,995][744089] Avg episode reward: [(0, '485.223')]
+[2023-03-09 15:38:59,008][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000073072_37412864.pth...
+[2023-03-09 15:38:59,010][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000072528_37134336.pth
+[2023-03-09 15:39:01,531][744402] Updated weights for policy 0, policy_version 73120 (0.0005)
+[2023-03-09 15:39:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 37457920. Throughput: 0: 9243.6. Samples: 37457992. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:03,995][744089] Avg episode reward: [(0, '485.148')]
+[2023-03-09 15:39:06,086][744402] Updated weights for policy 0, policy_version 73200 (0.0005)
+[2023-03-09 15:39:08,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 37502976. Throughput: 0: 9248.3. Samples: 37485172. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:09,006][744089] Avg episode reward: [(0, '485.755')]
+[2023-03-09 15:39:10,635][744402] Updated weights for policy 0, policy_version 73280 (0.0005)
+[2023-03-09 15:39:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.8, 300 sec: 9108.4). Total num frames: 37548032. Throughput: 0: 9198.2. Samples: 37539848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:13,995][744089] Avg episode reward: [(0, '479.311')]
+[2023-03-09 15:39:14,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000073336_37548032.pth...
+[2023-03-09 15:39:14,011][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000072800_37273600.pth
+[2023-03-09 15:39:15,016][744402] Updated weights for policy 0, policy_version 73360 (0.0005)
+[2023-03-09 15:39:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 37593088. Throughput: 0: 9144.3. Samples: 37593312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:18,995][744089] Avg episode reward: [(0, '483.231')]
+[2023-03-09 15:39:19,758][744402] Updated weights for policy 0, policy_version 73440 (0.0005)
+[2023-03-09 15:39:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 37638144. Throughput: 0: 9171.5. Samples: 37621188. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:23,995][744089] Avg episode reward: [(0, '439.757')]
+[2023-03-09 15:39:24,329][744402] Updated weights for policy 0, policy_version 73520 (0.0005)
+[2023-03-09 15:39:28,916][744402] Updated weights for policy 0, policy_version 73600 (0.0006)
+[2023-03-09 15:39:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9108.4). Total num frames: 37683200. Throughput: 0: 9079.9. Samples: 37673420. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:28,995][744089] Avg episode reward: [(0, '453.205')]
+[2023-03-09 15:39:29,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000073600_37683200.pth...
+[2023-03-09 15:39:29,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000073072_37412864.pth
+[2023-03-09 15:39:33,380][744402] Updated weights for policy 0, policy_version 73680 (0.0005)
+[2023-03-09 15:39:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.4, 300 sec: 9108.4). Total num frames: 37728256. Throughput: 0: 9050.6. Samples: 37728268. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:33,996][744089] Avg episode reward: [(0, '437.739')]
+[2023-03-09 15:39:38,025][744402] Updated weights for policy 0, policy_version 73760 (0.0005)
+[2023-03-09 15:39:38,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 37773312. Throughput: 0: 9002.0. Samples: 37754680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:38,995][744089] Avg episode reward: [(0, '507.886')]
+[2023-03-09 15:39:42,530][744402] Updated weights for policy 0, policy_version 73840 (0.0004)
+[2023-03-09 15:39:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 37818368. Throughput: 0: 8982.2. Samples: 37808936. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:43,996][744089] Avg episode reward: [(0, '453.871')]
+[2023-03-09 15:39:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000073864_37818368.pth...
+[2023-03-09 15:39:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000073336_37548032.pth
+[2023-03-09 15:39:47,191][744402] Updated weights for policy 0, policy_version 73920 (0.0005)
+[2023-03-09 15:39:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 37863424. Throughput: 0: 9007.1. Samples: 37863312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:48,996][744089] Avg episode reward: [(0, '487.455')]
+[2023-03-09 15:39:51,692][744402] Updated weights for policy 0, policy_version 74000 (0.0005)
+[2023-03-09 15:39:53,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9066.7). Total num frames: 37904384. Throughput: 0: 8970.9. Samples: 37888864. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:53,995][744089] Avg episode reward: [(0, '496.494')]
+[2023-03-09 15:39:56,128][744402] Updated weights for policy 0, policy_version 74080 (0.0005)
+[2023-03-09 15:39:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 37953536. Throughput: 0: 9009.5. Samples: 37945276. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:39:58,996][744089] Avg episode reward: [(0, '492.221')]
+[2023-03-09 15:39:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000074128_37953536.pth...
+[2023-03-09 15:39:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000073600_37683200.pth
+[2023-03-09 15:40:00,700][744402] Updated weights for policy 0, policy_version 74160 (0.0005)
+[2023-03-09 15:40:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 37998592. Throughput: 0: 8990.8. Samples: 37997900. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:40:03,996][744089] Avg episode reward: [(0, '493.724')]
+[2023-03-09 15:40:05,320][744402] Updated weights for policy 0, policy_version 74240 (0.0005)
+[2023-03-09 15:40:08,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8942.9, 300 sec: 9052.9). Total num frames: 38039552. Throughput: 0: 8941.5. Samples: 38023556. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:40:08,996][744089] Avg episode reward: [(0, '446.697')]
+[2023-03-09 15:40:09,946][744402] Updated weights for policy 0, policy_version 74320 (0.0005)
+[2023-03-09 15:40:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38088704. Throughput: 0: 8958.9. Samples: 38076572. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:40:13,996][744089] Avg episode reward: [(0, '480.966')]
+[2023-03-09 15:40:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000074392_38088704.pth...
+[2023-03-09 15:40:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000073864_37818368.pth
+[2023-03-09 15:40:14,327][744402] Updated weights for policy 0, policy_version 74400 (0.0005)
+[2023-03-09 15:40:18,633][744402] Updated weights for policy 0, policy_version 74480 (0.0005)
+[2023-03-09 15:40:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38133760. Throughput: 0: 9050.1. Samples: 38135524. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:40:18,995][744089] Avg episode reward: [(0, '462.158')]
+[2023-03-09 15:40:23,181][744402] Updated weights for policy 0, policy_version 74560 (0.0005)
+[2023-03-09 15:40:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38178816. Throughput: 0: 9062.6. Samples: 38162496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:40:23,995][744089] Avg episode reward: [(0, '472.571')]
+[2023-03-09 15:40:27,566][744402] Updated weights for policy 0, policy_version 74640 (0.0005)
+[2023-03-09 15:40:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.4, 300 sec: 9080.6). Total num frames: 38227968. Throughput: 0: 9097.5. Samples: 38218324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:40:28,996][744089] Avg episode reward: [(0, '456.130')]
+[2023-03-09 15:40:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000074664_38227968.pth...
+[2023-03-09 15:40:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000074128_37953536.pth
+[2023-03-09 15:40:32,060][744402] Updated weights for policy 0, policy_version 74720 (0.0005)
+[2023-03-09 15:40:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38268928. Throughput: 0: 9082.6. Samples: 38272028. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:40:33,995][744089] Avg episode reward: [(0, '450.328')]
+[2023-03-09 15:40:36,774][744402] Updated weights for policy 0, policy_version 74800 (0.0004)
+[2023-03-09 15:40:38,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38313984. Throughput: 0: 9084.6. Samples: 38297672. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:40:38,995][744089] Avg episode reward: [(0, '386.818')]
+[2023-03-09 15:40:41,274][744402] Updated weights for policy 0, policy_version 74880 (0.0005)
+[2023-03-09 15:40:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38359040. Throughput: 0: 9027.1. Samples: 38351496. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:40:43,995][744089] Avg episode reward: [(0, '458.309')]
+[2023-03-09 15:40:44,025][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000074928_38363136.pth...
+[2023-03-09 15:40:44,027][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000074392_38088704.pth
+[2023-03-09 15:40:46,000][744402] Updated weights for policy 0, policy_version 74960 (0.0005)
+[2023-03-09 15:40:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38404096. Throughput: 0: 9038.9. Samples: 38404648. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:40:48,995][744089] Avg episode reward: [(0, '451.081')]
+[2023-03-09 15:40:50,691][744402] Updated weights for policy 0, policy_version 75040 (0.0005)
+[2023-03-09 15:40:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 38449152. Throughput: 0: 9035.0. Samples: 38430132. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:40:53,996][744089] Avg episode reward: [(0, '456.982')]
+[2023-03-09 15:40:55,278][744402] Updated weights for policy 0, policy_version 75120 (0.0005)
+[2023-03-09 15:40:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38494208. Throughput: 0: 9060.5. Samples: 38484296. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:40:58,996][744089] Avg episode reward: [(0, '354.304')]
+[2023-03-09 15:40:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000075184_38494208.pth...
+[2023-03-09 15:40:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000074664_38227968.pth
+[2023-03-09 15:40:59,932][744402] Updated weights for policy 0, policy_version 75200 (0.0005)
+[2023-03-09 15:41:03,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8942.9, 300 sec: 9052.9). Total num frames: 38535168. Throughput: 0: 8891.9. Samples: 38535660. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:41:03,995][744089] Avg episode reward: [(0, '391.048')]
+[2023-03-09 15:41:04,624][744402] Updated weights for policy 0, policy_version 75280 (0.0005)
+[2023-03-09 15:41:08,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 38580224. Throughput: 0: 8911.5. Samples: 38563512. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:41:08,995][744089] Avg episode reward: [(0, '486.559')]
+[2023-03-09 15:41:09,123][744402] Updated weights for policy 0, policy_version 75360 (0.0005)
+[2023-03-09 15:41:13,457][744402] Updated weights for policy 0, policy_version 75440 (0.0005)
+[2023-03-09 15:41:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 38629376. Throughput: 0: 8902.9. Samples: 38618952. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:41:13,996][744089] Avg episode reward: [(0, '456.219')]
+[2023-03-09 15:41:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000075448_38629376.pth...
+[2023-03-09 15:41:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000074928_38363136.pth
+[2023-03-09 15:41:17,896][744402] Updated weights for policy 0, policy_version 75520 (0.0005)
+[2023-03-09 15:41:18,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 38674432. Throughput: 0: 8944.4. Samples: 38674528. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:41:18,995][744089] Avg episode reward: [(0, '448.396')]
+[2023-03-09 15:41:22,374][744402] Updated weights for policy 0, policy_version 75600 (0.0005)
+[2023-03-09 15:41:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 38719488. Throughput: 0: 9005.0. Samples: 38702896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:41:23,995][744089] Avg episode reward: [(0, '491.274')]
+[2023-03-09 15:41:26,939][744402] Updated weights for policy 0, policy_version 75680 (0.0004)
+[2023-03-09 15:41:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 9039.0). Total num frames: 38764544. Throughput: 0: 8996.8. Samples: 38756352. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:41:28,996][744089] Avg episode reward: [(0, '441.146')]
+[2023-03-09 15:41:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000075712_38764544.pth...
+[2023-03-09 15:41:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000075184_38494208.pth
+[2023-03-09 15:41:31,595][744402] Updated weights for policy 0, policy_version 75760 (0.0005)
+[2023-03-09 15:41:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9039.0). Total num frames: 38809600. Throughput: 0: 9000.4. Samples: 38809664. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:41:33,995][744089] Avg episode reward: [(0, '424.640')]
+[2023-03-09 15:41:36,148][744402] Updated weights for policy 0, policy_version 75840 (0.0005)
+[2023-03-09 15:41:38,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9039.0). Total num frames: 38854656. Throughput: 0: 9037.8. Samples: 38836832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:41:38,996][744089] Avg episode reward: [(0, '375.955')]
+[2023-03-09 15:41:40,609][744402] Updated weights for policy 0, policy_version 75920 (0.0005)
+[2023-03-09 15:41:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9025.1). Total num frames: 38899712. Throughput: 0: 9045.4. Samples: 38891336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:41:43,995][744089] Avg episode reward: [(0, '456.228')]
+[2023-03-09 15:41:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000075976_38899712.pth...
+[2023-03-09 15:41:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000075448_38629376.pth
+[2023-03-09 15:41:44,918][744402] Updated weights for policy 0, policy_version 76000 (0.0005)
+[2023-03-09 15:41:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9039.0). Total num frames: 38948864. Throughput: 0: 9173.8. Samples: 38948480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:41:48,996][744089] Avg episode reward: [(0, '488.710')]
+[2023-03-09 15:41:49,320][744402] Updated weights for policy 0, policy_version 76080 (0.0005)
+[2023-03-09 15:41:53,812][744402] Updated weights for policy 0, policy_version 76160 (0.0005)
+[2023-03-09 15:41:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9052.9). Total num frames: 38993920. Throughput: 0: 9197.4. Samples: 38977396. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:41:53,995][744089] Avg episode reward: [(0, '481.942')]
+[2023-03-09 15:41:58,253][744402] Updated weights for policy 0, policy_version 76240 (0.0005)
+[2023-03-09 15:41:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9039.0). Total num frames: 39038976. Throughput: 0: 9155.7. Samples: 39030956. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:41:58,995][744089] Avg episode reward: [(0, '459.390')]
+[2023-03-09 15:41:58,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000076248_39038976.pth...
+[2023-03-09 15:41:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000075712_38764544.pth
+[2023-03-09 15:42:02,732][744402] Updated weights for policy 0, policy_version 76320 (0.0005)
+[2023-03-09 15:42:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.8, 300 sec: 9052.9). Total num frames: 39084032. Throughput: 0: 9119.7. Samples: 39084912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:03,995][744089] Avg episode reward: [(0, '479.547')]
+[2023-03-09 15:42:07,416][744402] Updated weights for policy 0, policy_version 76400 (0.0005)
+[2023-03-09 15:42:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9039.0). Total num frames: 39129088. Throughput: 0: 9098.7. Samples: 39112336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:08,995][744089] Avg episode reward: [(0, '482.808')]
+[2023-03-09 15:42:11,965][744402] Updated weights for policy 0, policy_version 76480 (0.0004)
+[2023-03-09 15:42:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9039.0). Total num frames: 39174144. Throughput: 0: 9099.8. Samples: 39165844. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:13,995][744089] Avg episode reward: [(0, '380.822')]
+[2023-03-09 15:42:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000076512_39174144.pth...
+[2023-03-09 15:42:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000075976_38899712.pth
+[2023-03-09 15:42:16,416][744402] Updated weights for policy 0, policy_version 76560 (0.0005)
+[2023-03-09 15:42:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 39223296. Throughput: 0: 9172.1. Samples: 39222408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:18,995][744089] Avg episode reward: [(0, '424.301')]
+[2023-03-09 15:42:20,688][744402] Updated weights for policy 0, policy_version 76640 (0.0006)
+[2023-03-09 15:42:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 39268352. Throughput: 0: 9213.2. Samples: 39251424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:23,995][744089] Avg episode reward: [(0, '489.766')]
+[2023-03-09 15:42:25,030][744402] Updated weights for policy 0, policy_version 76720 (0.0005)
+[2023-03-09 15:42:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 39317504. Throughput: 0: 9242.7. Samples: 39307260. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:28,995][744089] Avg episode reward: [(0, '493.802')]
+[2023-03-09 15:42:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000076792_39317504.pth...
+[2023-03-09 15:42:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000076248_39038976.pth
+[2023-03-09 15:42:29,452][744402] Updated weights for policy 0, policy_version 76800 (0.0005)
+[2023-03-09 15:42:33,212][744402] Updated weights for policy 0, policy_version 76880 (0.0005)
+[2023-03-09 15:42:33,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9352.5, 300 sec: 9108.4). Total num frames: 39370752. Throughput: 0: 9343.1. Samples: 39368920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:33,995][744089] Avg episode reward: [(0, '489.363')]
+[2023-03-09 15:42:37,546][744402] Updated weights for policy 0, policy_version 76960 (0.0005)
+[2023-03-09 15:42:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9352.6, 300 sec: 9108.4). Total num frames: 39415808. Throughput: 0: 9357.2. Samples: 39398472. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:38,995][744089] Avg episode reward: [(0, '502.103')]
+[2023-03-09 15:42:41,736][744402] Updated weights for policy 0, policy_version 77040 (0.0005)
+[2023-03-09 15:42:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9122.3). Total num frames: 39464960. Throughput: 0: 9444.5. Samples: 39455960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:43,996][744089] Avg episode reward: [(0, '495.814')]
+[2023-03-09 15:42:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000077080_39464960.pth...
+[2023-03-09 15:42:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000076512_39174144.pth
+[2023-03-09 15:42:45,975][744402] Updated weights for policy 0, policy_version 77120 (0.0005)
+[2023-03-09 15:42:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9352.6, 300 sec: 9122.3). Total num frames: 39510016. Throughput: 0: 9466.4. Samples: 39510900. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:42:48,995][744089] Avg episode reward: [(0, '518.076')]
+[2023-03-09 15:42:48,996][744358] Saving new best policy, reward=518.076!
+[2023-03-09 15:42:50,521][744402] Updated weights for policy 0, policy_version 77200 (0.0005)
+[2023-03-09 15:42:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9352.5, 300 sec: 9122.3). Total num frames: 39555072. Throughput: 0: 9476.2. Samples: 39538764. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:42:53,995][744089] Avg episode reward: [(0, '480.250')]
+[2023-03-09 15:42:55,105][744402] Updated weights for policy 0, policy_version 77280 (0.0005)
+[2023-03-09 15:42:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 39600128. Throughput: 0: 9484.2. Samples: 39592632. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:42:58,995][744089] Avg episode reward: [(0, '479.076')]
+[2023-03-09 15:42:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000077344_39600128.pth...
+[2023-03-09 15:42:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000076792_39317504.pth
+[2023-03-09 15:42:59,511][744402] Updated weights for policy 0, policy_version 77360 (0.0005)
+[2023-03-09 15:43:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 39645184. Throughput: 0: 9459.4. Samples: 39648080. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:43:03,995][744089] Avg episode reward: [(0, '487.600')]
+[2023-03-09 15:43:04,068][744402] Updated weights for policy 0, policy_version 77440 (0.0005)
+[2023-03-09 15:43:08,494][744402] Updated weights for policy 0, policy_version 77520 (0.0004)
+[2023-03-09 15:43:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9136.2). Total num frames: 39694336. Throughput: 0: 9385.3. Samples: 39673764. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:43:08,995][744089] Avg episode reward: [(0, '498.647')]
+[2023-03-09 15:43:13,242][744402] Updated weights for policy 0, policy_version 77600 (0.0005)
+[2023-03-09 15:43:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 39735296. Throughput: 0: 9331.6. Samples: 39727184. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:43:13,996][744089] Avg episode reward: [(0, '486.797')]
+[2023-03-09 15:43:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000077608_39735296.pth...
+[2023-03-09 15:43:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000077080_39464960.pth
+[2023-03-09 15:43:17,565][744402] Updated weights for policy 0, policy_version 77680 (0.0005)
+[2023-03-09 15:43:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 39784448. Throughput: 0: 9221.7. Samples: 39783896. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:43:18,995][744089] Avg episode reward: [(0, '500.950')]
+[2023-03-09 15:43:21,965][744402] Updated weights for policy 0, policy_version 77760 (0.0006)
+[2023-03-09 15:43:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 39829504. Throughput: 0: 9186.1. Samples: 39811848. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:43:23,995][744089] Avg episode reward: [(0, '504.834')]
+[2023-03-09 15:43:26,383][744402] Updated weights for policy 0, policy_version 77840 (0.0005)
+[2023-03-09 15:43:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9284.3, 300 sec: 9122.3). Total num frames: 39874560. Throughput: 0: 9120.4. Samples: 39866376. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:43:28,996][744089] Avg episode reward: [(0, '484.798')]
+[2023-03-09 15:43:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000077880_39874560.pth...
+[2023-03-09 15:43:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000077344_39600128.pth
+[2023-03-09 15:43:30,841][744402] Updated weights for policy 0, policy_version 77920 (0.0005)
+[2023-03-09 15:43:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 39919616. Throughput: 0: 9119.5. Samples: 39921276. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:43:33,995][744089] Avg episode reward: [(0, '465.028')]
+[2023-03-09 15:43:35,258][744402] Updated weights for policy 0, policy_version 78000 (0.0004)
+[2023-03-09 15:43:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 39968768. Throughput: 0: 9165.9. Samples: 39951228. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:43:38,995][744089] Avg episode reward: [(0, '448.160')]
+[2023-03-09 15:43:39,687][744402] Updated weights for policy 0, policy_version 78080 (0.0005)
+[2023-03-09 15:43:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 40013824. Throughput: 0: 9174.9. Samples: 40005504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:43:43,995][744089] Avg episode reward: [(0, '466.373')]
+[2023-03-09 15:43:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000078152_40013824.pth...
+[2023-03-09 15:43:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000077608_39735296.pth
+[2023-03-09 15:43:44,265][744402] Updated weights for policy 0, policy_version 78160 (0.0005)
+[2023-03-09 15:43:48,627][744402] Updated weights for policy 0, policy_version 78240 (0.0005)
+[2023-03-09 15:43:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 40058880. Throughput: 0: 9167.2. Samples: 40060604. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:43:48,995][744089] Avg episode reward: [(0, '509.707')]
+[2023-03-09 15:43:53,356][744402] Updated weights for policy 0, policy_version 78320 (0.0004)
+[2023-03-09 15:43:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 40103936. Throughput: 0: 9189.9. Samples: 40087312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:43:53,996][744089] Avg episode reward: [(0, '474.458')]
+[2023-03-09 15:43:57,817][744402] Updated weights for policy 0, policy_version 78400 (0.0005)
+[2023-03-09 15:43:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 40148992. Throughput: 0: 9191.8. Samples: 40140812. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:43:58,995][744089] Avg episode reward: [(0, '482.526')]
+[2023-03-09 15:43:58,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000078416_40148992.pth...
+[2023-03-09 15:43:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000077880_39874560.pth
+[2023-03-09 15:44:02,245][744402] Updated weights for policy 0, policy_version 78480 (0.0005)
+[2023-03-09 15:44:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 40194048. Throughput: 0: 9130.1. Samples: 40194752. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:44:03,995][744089] Avg episode reward: [(0, '491.193')]
+[2023-03-09 15:44:06,886][744402] Updated weights for policy 0, policy_version 78560 (0.0004)
+[2023-03-09 15:44:08,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 40239104. Throughput: 0: 9127.9. Samples: 40222604. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:44:08,995][744089] Avg episode reward: [(0, '467.020')]
+[2023-03-09 15:44:11,372][744402] Updated weights for policy 0, policy_version 78640 (0.0005)
+[2023-03-09 15:44:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.8, 300 sec: 9122.3). Total num frames: 40284160. Throughput: 0: 9130.2. Samples: 40277232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:44:13,995][744089] Avg episode reward: [(0, '469.241')]
+[2023-03-09 15:44:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000078680_40284160.pth...
+[2023-03-09 15:44:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000078152_40013824.pth
+[2023-03-09 15:44:15,830][744402] Updated weights for policy 0, policy_version 78720 (0.0005)
+[2023-03-09 15:44:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 40329216. Throughput: 0: 9127.2. Samples: 40332000. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:44:18,995][744089] Avg episode reward: [(0, '513.419')]
+[2023-03-09 15:44:20,397][744402] Updated weights for policy 0, policy_version 78800 (0.0005)
+[2023-03-09 15:44:23,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 40378368. Throughput: 0: 9069.3. Samples: 40359348. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:44:23,995][744089] Avg episode reward: [(0, '464.600')]
+[2023-03-09 15:44:24,914][744402] Updated weights for policy 0, policy_version 78880 (0.0005)
+[2023-03-09 15:44:28,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 40419328. Throughput: 0: 9071.3. Samples: 40413712. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:44:28,995][744089] Avg episode reward: [(0, '422.373')]
+[2023-03-09 15:44:28,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000078944_40419328.pth...
+[2023-03-09 15:44:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000078416_40148992.pth
+[2023-03-09 15:44:29,650][744402] Updated weights for policy 0, policy_version 78960 (0.0005)
+[2023-03-09 15:44:33,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 40464384. Throughput: 0: 8971.3. Samples: 40464312. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:44:33,995][744089] Avg episode reward: [(0, '453.427')]
+[2023-03-09 15:44:34,314][744402] Updated weights for policy 0, policy_version 79040 (0.0004)
+[2023-03-09 15:44:38,700][744402] Updated weights for policy 0, policy_version 79120 (0.0005)
+[2023-03-09 15:44:38,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 40509440. Throughput: 0: 8976.4. Samples: 40491248. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:44:38,996][744089] Avg episode reward: [(0, '411.319')]
+[2023-03-09 15:44:43,300][744402] Updated weights for policy 0, policy_version 79200 (0.0005)
+[2023-03-09 15:44:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 40554496. Throughput: 0: 9012.3. Samples: 40546368. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:44:43,996][744089] Avg episode reward: [(0, '367.783')]
+[2023-03-09 15:44:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000079208_40554496.pth...
+[2023-03-09 15:44:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000078680_40284160.pth
+[2023-03-09 15:44:47,729][744402] Updated weights for policy 0, policy_version 79280 (0.0005)
+[2023-03-09 15:44:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 40599552. Throughput: 0: 9049.2. Samples: 40601964. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:44:48,995][744089] Avg episode reward: [(0, '318.972')]
+[2023-03-09 15:44:52,035][744402] Updated weights for policy 0, policy_version 79360 (0.0005)
+[2023-03-09 15:44:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 40648704. Throughput: 0: 9050.7. Samples: 40629884. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:44:53,996][744089] Avg episode reward: [(0, '436.506')]
+[2023-03-09 15:44:56,746][744402] Updated weights for policy 0, policy_version 79440 (0.0005)
+[2023-03-09 15:44:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 40693760. Throughput: 0: 9030.0. Samples: 40683584. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:44:58,995][744089] Avg episode reward: [(0, '295.327')]
+[2023-03-09 15:44:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000079480_40693760.pth...
+[2023-03-09 15:44:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000078944_40419328.pth
+[2023-03-09 15:45:01,096][744402] Updated weights for policy 0, policy_version 79520 (0.0005)
+[2023-03-09 15:45:03,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 40738816. Throughput: 0: 9057.2. Samples: 40739572. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:45:03,995][744089] Avg episode reward: [(0, '402.775')]
+[2023-03-09 15:45:05,605][744402] Updated weights for policy 0, policy_version 79600 (0.0004)
+[2023-03-09 15:45:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 40783872. Throughput: 0: 9039.2. Samples: 40766112. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:45:08,995][744089] Avg episode reward: [(0, '388.187')]
+[2023-03-09 15:45:10,340][744402] Updated weights for policy 0, policy_version 79680 (0.0005)
+[2023-03-09 15:45:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 40828928. Throughput: 0: 9037.9. Samples: 40820420. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 15:45:13,995][744089] Avg episode reward: [(0, '441.710')]
+[2023-03-09 15:45:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000079744_40828928.pth...
+[2023-03-09 15:45:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000079208_40554496.pth
+[2023-03-09 15:45:14,485][744402] Updated weights for policy 0, policy_version 79760 (0.0005)
+[2023-03-09 15:45:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 40873984. Throughput: 0: 9138.6. Samples: 40875548. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:18,995][744089] Avg episode reward: [(0, '445.933')]
+[2023-03-09 15:45:19,113][744402] Updated weights for policy 0, policy_version 79840 (0.0005)
+[2023-03-09 15:45:23,558][744402] Updated weights for policy 0, policy_version 79920 (0.0005)
+[2023-03-09 15:45:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9122.3). Total num frames: 40919040. Throughput: 0: 9142.2. Samples: 40902648. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:23,995][744089] Avg episode reward: [(0, '485.371')]
+[2023-03-09 15:45:28,178][744402] Updated weights for policy 0, policy_version 80000 (0.0005)
+[2023-03-09 15:45:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 40964096. Throughput: 0: 9115.4. Samples: 40956560. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:28,995][744089] Avg episode reward: [(0, '483.300')]
+[2023-03-09 15:45:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000080008_40964096.pth...
+[2023-03-09 15:45:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000079480_40693760.pth
+[2023-03-09 15:45:32,718][744402] Updated weights for policy 0, policy_version 80080 (0.0005)
+[2023-03-09 15:45:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 41009152. Throughput: 0: 9073.1. Samples: 41010256. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:33,995][744089] Avg episode reward: [(0, '492.999')]
+[2023-03-09 15:45:37,367][744402] Updated weights for policy 0, policy_version 80160 (0.0005)
+[2023-03-09 15:45:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 41054208. Throughput: 0: 9059.2. Samples: 41037548. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:38,995][744089] Avg episode reward: [(0, '477.919')]
+[2023-03-09 15:45:41,779][744402] Updated weights for policy 0, policy_version 80240 (0.0005)
+[2023-03-09 15:45:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 41099264. Throughput: 0: 9069.8. Samples: 41091724. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:43,995][744089] Avg episode reward: [(0, '518.845')]
+[2023-03-09 15:45:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000080272_41099264.pth...
+[2023-03-09 15:45:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000079744_40828928.pth
+[2023-03-09 15:45:44,000][744358] Saving new best policy, reward=518.845!
+[2023-03-09 15:45:46,503][744402] Updated weights for policy 0, policy_version 80320 (0.0005)
+[2023-03-09 15:45:48,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 41144320. Throughput: 0: 8994.4. Samples: 41144320. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:48,995][744089] Avg episode reward: [(0, '519.412')]
+[2023-03-09 15:45:48,996][744358] Saving new best policy, reward=519.412!
+[2023-03-09 15:45:51,174][744402] Updated weights for policy 0, policy_version 80400 (0.0005)
+[2023-03-09 15:45:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 41189376. Throughput: 0: 8994.9. Samples: 41170884. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:53,995][744089] Avg episode reward: [(0, '509.573')]
+[2023-03-09 15:45:55,605][744402] Updated weights for policy 0, policy_version 80480 (0.0005)
+[2023-03-09 15:45:58,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9150.1). Total num frames: 41234432. Throughput: 0: 9017.6. Samples: 41226212. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:45:58,995][744089] Avg episode reward: [(0, '522.770')]
+[2023-03-09 15:45:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000080536_41234432.pth...
+[2023-03-09 15:45:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000080008_40964096.pth
+[2023-03-09 15:45:59,001][744358] Saving new best policy, reward=522.770!
+[2023-03-09 15:46:00,178][744402] Updated weights for policy 0, policy_version 80560 (0.0005)
+[2023-03-09 15:46:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9150.0). Total num frames: 41279488. Throughput: 0: 8974.7. Samples: 41279412. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 15:46:03,995][744089] Avg episode reward: [(0, '509.618')]
+[2023-03-09 15:46:04,815][744402] Updated weights for policy 0, policy_version 80640 (0.0005)
+[2023-03-09 15:46:08,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 41324544. Throughput: 0: 8947.4. Samples: 41305284. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:08,996][744089] Avg episode reward: [(0, '510.590')]
+[2023-03-09 15:46:09,336][744402] Updated weights for policy 0, policy_version 80720 (0.0005)
+[2023-03-09 15:46:13,982][744402] Updated weights for policy 0, policy_version 80800 (0.0005)
+[2023-03-09 15:46:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 41369600. Throughput: 0: 8976.4. Samples: 41360500. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:13,996][744089] Avg episode reward: [(0, '485.959')]
+[2023-03-09 15:46:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000080800_41369600.pth...
+[2023-03-09 15:46:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000080272_41099264.pth
+[2023-03-09 15:46:18,562][744402] Updated weights for policy 0, policy_version 80880 (0.0005)
+[2023-03-09 15:46:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 41414656. Throughput: 0: 8958.8. Samples: 41413400. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:18,995][744089] Avg episode reward: [(0, '478.376')]
+[2023-03-09 15:46:23,094][744402] Updated weights for policy 0, policy_version 80960 (0.0005)
+[2023-03-09 15:46:23,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9122.3). Total num frames: 41455616. Throughput: 0: 8943.8. Samples: 41440020. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:23,995][744089] Avg episode reward: [(0, '489.671')]
+[2023-03-09 15:46:27,717][744402] Updated weights for policy 0, policy_version 81040 (0.0005)
+[2023-03-09 15:46:28,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9122.3). Total num frames: 41500672. Throughput: 0: 8920.3. Samples: 41493136. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:28,995][744089] Avg episode reward: [(0, '498.747')]
+[2023-03-09 15:46:29,042][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000081064_41504768.pth...
+[2023-03-09 15:46:29,044][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000080536_41234432.pth
+[2023-03-09 15:46:32,058][744402] Updated weights for policy 0, policy_version 81120 (0.0006)
+[2023-03-09 15:46:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 41549824. Throughput: 0: 9000.6. Samples: 41549348. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:33,995][744089] Avg episode reward: [(0, '506.223')]
+[2023-03-09 15:46:36,552][744402] Updated weights for policy 0, policy_version 81200 (0.0005)
+[2023-03-09 15:46:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 41594880. Throughput: 0: 9026.4. Samples: 41577072. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:38,995][744089] Avg episode reward: [(0, '483.200')]
+[2023-03-09 15:46:41,310][744402] Updated weights for policy 0, policy_version 81280 (0.0005)
+[2023-03-09 15:46:43,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 41635840. Throughput: 0: 8927.1. Samples: 41627932. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:43,995][744089] Avg episode reward: [(0, '497.545')]
+[2023-03-09 15:46:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000081320_41635840.pth...
+[2023-03-09 15:46:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000080800_41369600.pth
+[2023-03-09 15:46:46,019][744402] Updated weights for policy 0, policy_version 81360 (0.0005)
+[2023-03-09 15:46:48,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 41680896. Throughput: 0: 8931.5. Samples: 41681328. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:48,996][744089] Avg episode reward: [(0, '465.367')]
+[2023-03-09 15:46:50,410][744402] Updated weights for policy 0, policy_version 81440 (0.0005)
+[2023-03-09 15:46:53,995][744089] Fps is (10 sec: 9011.0, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 41725952. Throughput: 0: 8984.1. Samples: 41709568. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 15:46:53,996][744089] Avg episode reward: [(0, '490.355')]
+[2023-03-09 15:46:55,009][744402] Updated weights for policy 0, policy_version 81520 (0.0005)
+[2023-03-09 15:46:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 41771008. Throughput: 0: 8952.2. Samples: 41763348. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:46:58,996][744089] Avg episode reward: [(0, '483.016')]
+[2023-03-09 15:46:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000081584_41771008.pth...
+[2023-03-09 15:46:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000081064_41504768.pth
+[2023-03-09 15:46:59,614][744402] Updated weights for policy 0, policy_version 81600 (0.0005)
+[2023-03-09 15:47:03,995][744089] Fps is (10 sec: 9011.4, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 41816064. Throughput: 0: 8960.6. Samples: 41816628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:03,995][744089] Avg episode reward: [(0, '484.521')]
+[2023-03-09 15:47:04,159][744402] Updated weights for policy 0, policy_version 81680 (0.0005)
+[2023-03-09 15:47:08,711][744402] Updated weights for policy 0, policy_version 81760 (0.0005)
+[2023-03-09 15:47:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 41861120. Throughput: 0: 8972.2. Samples: 41843768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:08,996][744089] Avg episode reward: [(0, '481.743')]
+[2023-03-09 15:47:13,050][744402] Updated weights for policy 0, policy_version 81840 (0.0005)
+[2023-03-09 15:47:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8943.0, 300 sec: 9094.5). Total num frames: 41906176. Throughput: 0: 9042.0. Samples: 41900024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:13,995][744089] Avg episode reward: [(0, '502.485')]
+[2023-03-09 15:47:14,008][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000081856_41910272.pth...
+[2023-03-09 15:47:14,010][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000081320_41635840.pth
+[2023-03-09 15:47:17,566][744402] Updated weights for policy 0, policy_version 81920 (0.0005)
+[2023-03-09 15:47:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 41955328. Throughput: 0: 9015.8. Samples: 41955060. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:18,996][744089] Avg episode reward: [(0, '508.574')]
+[2023-03-09 15:47:21,979][744402] Updated weights for policy 0, policy_version 82000 (0.0005)
+[2023-03-09 15:47:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 42000384. Throughput: 0: 9027.6. Samples: 41983312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:23,995][744089] Avg episode reward: [(0, '507.352')]
+[2023-03-09 15:47:26,300][744402] Updated weights for policy 0, policy_version 82080 (0.0005)
+[2023-03-09 15:47:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 42049536. Throughput: 0: 9125.7. Samples: 42038592. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:28,996][744089] Avg episode reward: [(0, '501.866')]
+[2023-03-09 15:47:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000082128_42049536.pth...
+[2023-03-09 15:47:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000081584_41771008.pth
+[2023-03-09 15:47:30,837][744402] Updated weights for policy 0, policy_version 82160 (0.0005)
+[2023-03-09 15:47:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9066.7). Total num frames: 42090496. Throughput: 0: 9129.7. Samples: 42092164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:33,995][744089] Avg episode reward: [(0, '483.193')]
+[2023-03-09 15:47:35,445][744402] Updated weights for policy 0, policy_version 82240 (0.0005)
+[2023-03-09 15:47:38,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 42135552. Throughput: 0: 9099.8. Samples: 42119060. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:38,996][744089] Avg episode reward: [(0, '457.982')]
+[2023-03-09 15:47:40,002][744402] Updated weights for policy 0, policy_version 82320 (0.0005)
+[2023-03-09 15:47:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.4, 300 sec: 9052.8). Total num frames: 42180608. Throughput: 0: 9090.0. Samples: 42172400. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:43,996][744089] Avg episode reward: [(0, '501.870')]
+[2023-03-09 15:47:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000082384_42180608.pth...
+[2023-03-09 15:47:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000081856_41910272.pth
+[2023-03-09 15:47:44,814][744402] Updated weights for policy 0, policy_version 82400 (0.0005)
+[2023-03-09 15:47:48,735][744402] Updated weights for policy 0, policy_version 82480 (0.0005)
+[2023-03-09 15:47:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 42229760. Throughput: 0: 9191.1. Samples: 42230228. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:48,995][744089] Avg episode reward: [(0, '487.843')]
+[2023-03-09 15:47:53,244][744402] Updated weights for policy 0, policy_version 82560 (0.0005)
+[2023-03-09 15:47:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 42274816. Throughput: 0: 9215.2. Samples: 42258452. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:53,995][744089] Avg episode reward: [(0, '497.676')]
+[2023-03-09 15:47:57,465][744402] Updated weights for policy 0, policy_version 82640 (0.0005)
+[2023-03-09 15:47:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 42323968. Throughput: 0: 9235.9. Samples: 42315640. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:47:58,996][744089] Avg episode reward: [(0, '508.582')]
+[2023-03-09 15:47:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000082664_42323968.pth...
+[2023-03-09 15:47:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000082128_42049536.pth
+[2023-03-09 15:48:01,940][744402] Updated weights for policy 0, policy_version 82720 (0.0005)
+[2023-03-09 15:48:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9066.7). Total num frames: 42369024. Throughput: 0: 9205.6. Samples: 42369312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:03,995][744089] Avg episode reward: [(0, '480.763')]
+[2023-03-09 15:48:06,405][744402] Updated weights for policy 0, policy_version 82800 (0.0005)
+[2023-03-09 15:48:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 42414080. Throughput: 0: 9208.5. Samples: 42397696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:08,996][744089] Avg episode reward: [(0, '506.375')]
+[2023-03-09 15:48:10,928][744402] Updated weights for policy 0, policy_version 82880 (0.0004)
+[2023-03-09 15:48:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9066.7). Total num frames: 42459136. Throughput: 0: 9169.9. Samples: 42451236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:13,995][744089] Avg episode reward: [(0, '494.070')]
+[2023-03-09 15:48:13,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000082928_42459136.pth...
+[2023-03-09 15:48:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000082384_42180608.pth
+[2023-03-09 15:48:15,508][744402] Updated weights for policy 0, policy_version 82960 (0.0005)
+[2023-03-09 15:48:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 42504192. Throughput: 0: 9187.7. Samples: 42505612. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:18,995][744089] Avg episode reward: [(0, '476.832')]
+[2023-03-09 15:48:20,011][744402] Updated weights for policy 0, policy_version 83040 (0.0005)
+[2023-03-09 15:48:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 42549248. Throughput: 0: 9181.6. Samples: 42532232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:23,995][744089] Avg episode reward: [(0, '485.674')]
+[2023-03-09 15:48:24,654][744402] Updated weights for policy 0, policy_version 83120 (0.0005)
+[2023-03-09 15:48:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 42594304. Throughput: 0: 9153.3. Samples: 42584300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:28,995][744089] Avg episode reward: [(0, '486.654')]
+[2023-03-09 15:48:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000083192_42594304.pth...
+[2023-03-09 15:48:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000082664_42323968.pth
+[2023-03-09 15:48:29,296][744402] Updated weights for policy 0, policy_version 83200 (0.0005)
+[2023-03-09 15:48:33,888][744402] Updated weights for policy 0, policy_version 83280 (0.0005)
+[2023-03-09 15:48:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9052.9). Total num frames: 42639360. Throughput: 0: 9089.5. Samples: 42639256. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:33,995][744089] Avg episode reward: [(0, '480.214')]
+[2023-03-09 15:48:38,541][744402] Updated weights for policy 0, policy_version 83360 (0.0005)
+[2023-03-09 15:48:38,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 9039.0). Total num frames: 42680320. Throughput: 0: 9045.1. Samples: 42665480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:38,995][744089] Avg episode reward: [(0, '480.198')]
+[2023-03-09 15:48:43,131][744402] Updated weights for policy 0, policy_version 83440 (0.0005)
+[2023-03-09 15:48:43,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9039.0). Total num frames: 42725376. Throughput: 0: 8957.7. Samples: 42718736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:43,995][744089] Avg episode reward: [(0, '489.583')]
+[2023-03-09 15:48:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000083448_42725376.pth...
+[2023-03-09 15:48:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000082928_42459136.pth
+[2023-03-09 15:48:47,867][744402] Updated weights for policy 0, policy_version 83520 (0.0005)
+[2023-03-09 15:48:48,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9039.0). Total num frames: 42770432. Throughput: 0: 8934.8. Samples: 42771380. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:48,995][744089] Avg episode reward: [(0, '498.614')]
+[2023-03-09 15:48:52,336][744402] Updated weights for policy 0, policy_version 83600 (0.0004)
+[2023-03-09 15:48:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9039.0). Total num frames: 42815488. Throughput: 0: 8920.1. Samples: 42799100. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:53,995][744089] Avg episode reward: [(0, '468.804')]
+[2023-03-09 15:48:56,777][744402] Updated weights for policy 0, policy_version 83680 (0.0006)
+[2023-03-09 15:48:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9039.0). Total num frames: 42860544. Throughput: 0: 8915.1. Samples: 42852416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:48:58,995][744089] Avg episode reward: [(0, '484.706')]
+[2023-03-09 15:48:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000083712_42860544.pth...
+[2023-03-09 15:48:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000083192_42594304.pth
+[2023-03-09 15:49:01,348][744402] Updated weights for policy 0, policy_version 83760 (0.0005)
+[2023-03-09 15:49:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 9039.0). Total num frames: 42905600. Throughput: 0: 8939.7. Samples: 42907896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:03,995][744089] Avg episode reward: [(0, '436.700')]
+[2023-03-09 15:49:05,865][744402] Updated weights for policy 0, policy_version 83840 (0.0005)
+[2023-03-09 15:49:08,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 42954752. Throughput: 0: 8936.6. Samples: 42934380. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:08,996][744089] Avg episode reward: [(0, '482.593')]
+[2023-03-09 15:49:10,395][744402] Updated weights for policy 0, policy_version 83920 (0.0005)
+[2023-03-09 15:49:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 42999808. Throughput: 0: 9051.7. Samples: 42991628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:13,996][744089] Avg episode reward: [(0, '482.563')]
+[2023-03-09 15:49:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000083984_42999808.pth...
+[2023-03-09 15:49:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000083448_42725376.pth
+[2023-03-09 15:49:14,495][744402] Updated weights for policy 0, policy_version 84000 (0.0005)
+[2023-03-09 15:49:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9039.0). Total num frames: 43044864. Throughput: 0: 9015.7. Samples: 43044960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:18,995][744089] Avg episode reward: [(0, '481.169')]
+[2023-03-09 15:49:19,217][744402] Updated weights for policy 0, policy_version 84080 (0.0005)
+[2023-03-09 15:49:23,565][744402] Updated weights for policy 0, policy_version 84160 (0.0005)
+[2023-03-09 15:49:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 43089920. Throughput: 0: 9069.3. Samples: 43073600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:23,995][744089] Avg episode reward: [(0, '463.172')]
+[2023-03-09 15:49:28,114][744402] Updated weights for policy 0, policy_version 84240 (0.0005)
+[2023-03-09 15:49:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 43139072. Throughput: 0: 9084.0. Samples: 43127516. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:28,995][744089] Avg episode reward: [(0, '497.919')]
+[2023-03-09 15:49:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000084256_43139072.pth...
+[2023-03-09 15:49:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000083712_42860544.pth
+[2023-03-09 15:49:32,543][744402] Updated weights for policy 0, policy_version 84320 (0.0005)
+[2023-03-09 15:49:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 43184128. Throughput: 0: 9168.1. Samples: 43183944. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:33,996][744089] Avg episode reward: [(0, '472.817')]
+[2023-03-09 15:49:37,077][744402] Updated weights for policy 0, policy_version 84400 (0.0005)
+[2023-03-09 15:49:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 43229184. Throughput: 0: 9147.0. Samples: 43210716. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:38,995][744089] Avg episode reward: [(0, '487.785')]
+[2023-03-09 15:49:41,650][744402] Updated weights for policy 0, policy_version 84480 (0.0005)
+[2023-03-09 15:49:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9066.7). Total num frames: 43274240. Throughput: 0: 9191.1. Samples: 43266016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:43,996][744089] Avg episode reward: [(0, '477.725')]
+[2023-03-09 15:49:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000084520_43274240.pth...
+[2023-03-09 15:49:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000083984_42999808.pth
+[2023-03-09 15:49:45,982][744402] Updated weights for policy 0, policy_version 84560 (0.0005)
+[2023-03-09 15:49:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9052.9). Total num frames: 43319296. Throughput: 0: 9172.7. Samples: 43320668. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:48,995][744089] Avg episode reward: [(0, '470.505')]
+[2023-03-09 15:49:50,443][744402] Updated weights for policy 0, policy_version 84640 (0.0005)
+[2023-03-09 15:49:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9052.9). Total num frames: 43364352. Throughput: 0: 9190.9. Samples: 43347968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:53,995][744089] Avg episode reward: [(0, '499.544')]
+[2023-03-09 15:49:55,024][744402] Updated weights for policy 0, policy_version 84720 (0.0005)
+[2023-03-09 15:49:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9052.9). Total num frames: 43409408. Throughput: 0: 9103.4. Samples: 43401280. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:49:58,996][744089] Avg episode reward: [(0, '496.323')]
+[2023-03-09 15:49:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000084784_43409408.pth...
+[2023-03-09 15:49:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000084256_43139072.pth
+[2023-03-09 15:49:59,562][744402] Updated weights for policy 0, policy_version 84800 (0.0005)
+[2023-03-09 15:50:03,965][744402] Updated weights for policy 0, policy_version 84880 (0.0005)
+[2023-03-09 15:50:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9066.7). Total num frames: 43458560. Throughput: 0: 9161.1. Samples: 43457208. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:50:03,996][744089] Avg episode reward: [(0, '456.898')]
+[2023-03-09 15:50:08,548][744402] Updated weights for policy 0, policy_version 84960 (0.0006)
+[2023-03-09 15:50:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9052.9). Total num frames: 43499520. Throughput: 0: 9112.4. Samples: 43483656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:50:08,995][744089] Avg episode reward: [(0, '478.122')]
+[2023-03-09 15:50:12,818][744402] Updated weights for policy 0, policy_version 85040 (0.0005)
+[2023-03-09 15:50:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 43552768. Throughput: 0: 9177.0. Samples: 43540480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:50:13,995][744089] Avg episode reward: [(0, '477.621')]
+[2023-03-09 15:50:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000085064_43552768.pth...
+[2023-03-09 15:50:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000084520_43274240.pth
+[2023-03-09 15:50:16,952][744402] Updated weights for policy 0, policy_version 85120 (0.0005)
+[2023-03-09 15:50:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 43597824. Throughput: 0: 9198.8. Samples: 43597888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:50:18,995][744089] Avg episode reward: [(0, '488.633')]
+[2023-03-09 15:50:21,569][744402] Updated weights for policy 0, policy_version 85200 (0.0006)
+[2023-03-09 15:50:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 43642880. Throughput: 0: 9205.3. Samples: 43624956. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:50:23,995][744089] Avg episode reward: [(0, '437.745')]
+[2023-03-09 15:50:26,075][744402] Updated weights for policy 0, policy_version 85280 (0.0004)
+[2023-03-09 15:50:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 43687936. Throughput: 0: 9191.4. Samples: 43679628. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:50:28,996][744089] Avg episode reward: [(0, '462.397')]
+[2023-03-09 15:50:29,001][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000085328_43687936.pth...
+[2023-03-09 15:50:29,005][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000084784_43409408.pth
+[2023-03-09 15:50:30,840][744402] Updated weights for policy 0, policy_version 85360 (0.0005)
+[2023-03-09 15:50:33,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 43728896. Throughput: 0: 9126.7. Samples: 43731368. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:50:33,995][744089] Avg episode reward: [(0, '508.640')]
+[2023-03-09 15:50:35,264][744402] Updated weights for policy 0, policy_version 85440 (0.0005)
+[2023-03-09 15:50:38,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 43778048. Throughput: 0: 9146.1. Samples: 43759544. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:50:38,995][744089] Avg episode reward: [(0, '438.781')]
+[2023-03-09 15:50:39,831][744402] Updated weights for policy 0, policy_version 85520 (0.0005)
+[2023-03-09 15:50:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 43823104. Throughput: 0: 9154.2. Samples: 43813220. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:50:43,996][744089] Avg episode reward: [(0, '449.879')]
+[2023-03-09 15:50:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000085592_43823104.pth...
+[2023-03-09 15:50:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000085064_43552768.pth
+[2023-03-09 15:50:44,283][744402] Updated weights for policy 0, policy_version 85600 (0.0005)
+[2023-03-09 15:50:48,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9066.7). Total num frames: 43864064. Throughput: 0: 9112.8. Samples: 43867284. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:50:48,995][744089] Avg episode reward: [(0, '511.043')]
+[2023-03-09 15:50:49,000][744402] Updated weights for policy 0, policy_version 85680 (0.0006)
+[2023-03-09 15:50:53,428][744402] Updated weights for policy 0, policy_version 85760 (0.0005)
+[2023-03-09 15:50:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 43913216. Throughput: 0: 9118.4. Samples: 43893984. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:50:53,995][744089] Avg episode reward: [(0, '504.560')]
+[2023-03-09 15:50:58,056][744402] Updated weights for policy 0, policy_version 85840 (0.0004)
+[2023-03-09 15:50:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 43958272. Throughput: 0: 9074.0. Samples: 43948812. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:50:58,995][744089] Avg episode reward: [(0, '443.230')]
+[2023-03-09 15:50:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000085856_43958272.pth...
+[2023-03-09 15:50:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000085328_43687936.pth
+[2023-03-09 15:51:02,516][744402] Updated weights for policy 0, policy_version 85920 (0.0005)
+[2023-03-09 15:51:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9080.6). Total num frames: 44003328. Throughput: 0: 9009.3. Samples: 44003308. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:51:03,996][744089] Avg episode reward: [(0, '494.745')]
+[2023-03-09 15:51:07,054][744402] Updated weights for policy 0, policy_version 86000 (0.0006)
+[2023-03-09 15:51:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9080.6). Total num frames: 44048384. Throughput: 0: 9000.9. Samples: 44029996. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 15:51:08,995][744089] Avg episode reward: [(0, '448.718')]
+[2023-03-09 15:51:11,500][744402] Updated weights for policy 0, policy_version 86080 (0.0005)
+[2023-03-09 15:51:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 44093440. Throughput: 0: 9009.5. Samples: 44085056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:13,995][744089] Avg episode reward: [(0, '400.467')]
+[2023-03-09 15:51:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000086120_44093440.pth...
+[2023-03-09 15:51:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000085592_43823104.pth
+[2023-03-09 15:51:16,005][744402] Updated weights for policy 0, policy_version 86160 (0.0005)
+[2023-03-09 15:51:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 44138496. Throughput: 0: 9072.0. Samples: 44139608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:18,995][744089] Avg episode reward: [(0, '353.240')]
+[2023-03-09 15:51:20,469][744402] Updated weights for policy 0, policy_version 86240 (0.0005)
+[2023-03-09 15:51:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 44187648. Throughput: 0: 9062.5. Samples: 44167356. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:23,995][744089] Avg episode reward: [(0, '387.042')]
+[2023-03-09 15:51:24,732][744402] Updated weights for policy 0, policy_version 86320 (0.0004)
+[2023-03-09 15:51:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 44232704. Throughput: 0: 9128.3. Samples: 44223992. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:28,996][744089] Avg episode reward: [(0, '391.797')]
+[2023-03-09 15:51:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000086392_44232704.pth...
+[2023-03-09 15:51:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000085856_43958272.pth
+[2023-03-09 15:51:29,273][744402] Updated weights for policy 0, policy_version 86400 (0.0004)
+[2023-03-09 15:51:33,723][744402] Updated weights for policy 0, policy_version 86480 (0.0004)
+[2023-03-09 15:51:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9094.5). Total num frames: 44277760. Throughput: 0: 9131.6. Samples: 44278208. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:33,996][744089] Avg episode reward: [(0, '438.555')]
+[2023-03-09 15:51:38,212][744402] Updated weights for policy 0, policy_version 86560 (0.0005)
+[2023-03-09 15:51:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 44322816. Throughput: 0: 9165.6. Samples: 44306436. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:38,995][744089] Avg episode reward: [(0, '442.665')]
+[2023-03-09 15:51:42,582][744402] Updated weights for policy 0, policy_version 86640 (0.0004)
+[2023-03-09 15:51:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 44371968. Throughput: 0: 9185.2. Samples: 44362144. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:43,995][744089] Avg episode reward: [(0, '460.408')]
+[2023-03-09 15:51:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000086664_44371968.pth...
+[2023-03-09 15:51:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000086120_44093440.pth
+[2023-03-09 15:51:46,970][744402] Updated weights for policy 0, policy_version 86720 (0.0005)
+[2023-03-09 15:51:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 44417024. Throughput: 0: 9204.4. Samples: 44417508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:48,996][744089] Avg episode reward: [(0, '460.752')]
+[2023-03-09 15:51:51,765][744402] Updated weights for policy 0, policy_version 86800 (0.0005)
+[2023-03-09 15:51:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 44462080. Throughput: 0: 9148.9. Samples: 44441696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:53,996][744089] Avg episode reward: [(0, '472.272')]
+[2023-03-09 15:51:56,277][744402] Updated weights for policy 0, policy_version 86880 (0.0005)
+[2023-03-09 15:51:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 44503040. Throughput: 0: 9113.3. Samples: 44495156. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:51:58,996][744089] Avg episode reward: [(0, '474.065')]
+[2023-03-09 15:51:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000086920_44503040.pth...
+[2023-03-09 15:51:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000086392_44232704.pth
+[2023-03-09 15:52:00,979][744402] Updated weights for policy 0, policy_version 86960 (0.0005)
+[2023-03-09 15:52:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 44552192. Throughput: 0: 9167.8. Samples: 44552160. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:03,995][744089] Avg episode reward: [(0, '401.600')]
+[2023-03-09 15:52:05,191][744402] Updated weights for policy 0, policy_version 87040 (0.0005)
+[2023-03-09 15:52:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 44601344. Throughput: 0: 9158.5. Samples: 44579488. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:08,996][744089] Avg episode reward: [(0, '451.052')]
+[2023-03-09 15:52:09,404][744402] Updated weights for policy 0, policy_version 87120 (0.0005)
+[2023-03-09 15:52:13,914][744402] Updated weights for policy 0, policy_version 87200 (0.0005)
+[2023-03-09 15:52:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 44646400. Throughput: 0: 9154.7. Samples: 44635952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:13,996][744089] Avg episode reward: [(0, '505.575')]
+[2023-03-09 15:52:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000087200_44646400.pth...
+[2023-03-09 15:52:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000086664_44371968.pth
+[2023-03-09 15:52:18,122][744402] Updated weights for policy 0, policy_version 87280 (0.0005)
+[2023-03-09 15:52:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 44695552. Throughput: 0: 9242.9. Samples: 44694140. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:18,996][744089] Avg episode reward: [(0, '508.219')]
+[2023-03-09 15:52:22,456][744402] Updated weights for policy 0, policy_version 87360 (0.0005)
+[2023-03-09 15:52:23,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9216.0, 300 sec: 9122.3). Total num frames: 44740608. Throughput: 0: 9267.8. Samples: 44723488. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:23,996][744089] Avg episode reward: [(0, '501.962')]
+[2023-03-09 15:52:26,703][744402] Updated weights for policy 0, policy_version 87440 (0.0005)
+[2023-03-09 15:52:28,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9150.0). Total num frames: 44789760. Throughput: 0: 9305.3. Samples: 44780884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:28,996][744089] Avg episode reward: [(0, '521.487')]
+[2023-03-09 15:52:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000087480_44789760.pth...
+[2023-03-09 15:52:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000086920_44503040.pth
+[2023-03-09 15:52:30,987][744402] Updated weights for policy 0, policy_version 87520 (0.0005)
+[2023-03-09 15:52:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9150.0). Total num frames: 44834816. Throughput: 0: 9274.9. Samples: 44834880. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:33,995][744089] Avg episode reward: [(0, '522.411')]
+[2023-03-09 15:52:35,548][744402] Updated weights for policy 0, policy_version 87600 (0.0005)
+[2023-03-09 15:52:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9150.1). Total num frames: 44879872. Throughput: 0: 9365.4. Samples: 44863136. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:38,995][744089] Avg episode reward: [(0, '522.229')]
+[2023-03-09 15:52:39,955][744402] Updated weights for policy 0, policy_version 87680 (0.0005)
+[2023-03-09 15:52:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9150.0). Total num frames: 44929024. Throughput: 0: 9413.3. Samples: 44918756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:43,996][744089] Avg episode reward: [(0, '514.583')]
+[2023-03-09 15:52:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000087752_44929024.pth...
+[2023-03-09 15:52:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000087200_44646400.pth
+[2023-03-09 15:52:44,374][744402] Updated weights for policy 0, policy_version 87760 (0.0006)
+[2023-03-09 15:52:48,859][744402] Updated weights for policy 0, policy_version 87840 (0.0005)
+[2023-03-09 15:52:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9150.0). Total num frames: 44974080. Throughput: 0: 9376.0. Samples: 44974080. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:48,995][744089] Avg episode reward: [(0, '515.936')]
+[2023-03-09 15:52:53,306][744402] Updated weights for policy 0, policy_version 87920 (0.0004)
+[2023-03-09 15:52:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9136.2). Total num frames: 45019136. Throughput: 0: 9392.2. Samples: 45002136. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:53,995][744089] Avg episode reward: [(0, '512.181')]
+[2023-03-09 15:52:57,789][744402] Updated weights for policy 0, policy_version 88000 (0.0006)
+[2023-03-09 15:52:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 45064192. Throughput: 0: 9335.9. Samples: 45056064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:52:58,995][744089] Avg episode reward: [(0, '502.831')]
+[2023-03-09 15:52:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000088016_45064192.pth...
+[2023-03-09 15:52:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000087480_44789760.pth
+[2023-03-09 15:53:02,029][744402] Updated weights for policy 0, policy_version 88080 (0.0005)
+[2023-03-09 15:53:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9352.5, 300 sec: 9150.0). Total num frames: 45113344. Throughput: 0: 9308.3. Samples: 45113012. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:03,995][744089] Avg episode reward: [(0, '507.204')]
+[2023-03-09 15:53:06,596][744402] Updated weights for policy 0, policy_version 88160 (0.0004)
+[2023-03-09 15:53:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9150.0). Total num frames: 45158400. Throughput: 0: 9261.9. Samples: 45140272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:08,995][744089] Avg episode reward: [(0, '511.184')]
+[2023-03-09 15:53:11,155][744402] Updated weights for policy 0, policy_version 88240 (0.0006)
+[2023-03-09 15:53:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9284.3, 300 sec: 9150.0). Total num frames: 45203456. Throughput: 0: 9188.6. Samples: 45194372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:13,996][744089] Avg episode reward: [(0, '518.978')]
+[2023-03-09 15:53:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000088288_45203456.pth...
+[2023-03-09 15:53:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000087752_44929024.pth
+[2023-03-09 15:53:15,359][744402] Updated weights for policy 0, policy_version 88320 (0.0006)
+[2023-03-09 15:53:18,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9163.9). Total num frames: 45252608. Throughput: 0: 9282.8. Samples: 45252608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:18,995][744089] Avg episode reward: [(0, '520.110')]
+[2023-03-09 15:53:19,736][744402] Updated weights for policy 0, policy_version 88400 (0.0005)
+[2023-03-09 15:53:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9163.9). Total num frames: 45297664. Throughput: 0: 9293.5. Samples: 45281344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:23,995][744089] Avg episode reward: [(0, '517.150')]
+[2023-03-09 15:53:24,183][744402] Updated weights for policy 0, policy_version 88480 (0.0005)
+[2023-03-09 15:53:28,792][744402] Updated weights for policy 0, policy_version 88560 (0.0005)
+[2023-03-09 15:53:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9163.9). Total num frames: 45342720. Throughput: 0: 9220.1. Samples: 45333660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:28,995][744089] Avg episode reward: [(0, '479.234')]
+[2023-03-09 15:53:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000088560_45342720.pth...
+[2023-03-09 15:53:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000088016_45064192.pth
+[2023-03-09 15:53:33,493][744402] Updated weights for policy 0, policy_version 88640 (0.0005)
+[2023-03-09 15:53:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 45387776. Throughput: 0: 9183.4. Samples: 45387332. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:33,996][744089] Avg episode reward: [(0, '489.524')]
+[2023-03-09 15:53:38,102][744402] Updated weights for policy 0, policy_version 88720 (0.0005)
+[2023-03-09 15:53:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 45432832. Throughput: 0: 9125.1. Samples: 45412768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:38,995][744089] Avg episode reward: [(0, '480.478')]
+[2023-03-09 15:53:42,540][744402] Updated weights for policy 0, policy_version 88800 (0.0005)
+[2023-03-09 15:53:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 45477888. Throughput: 0: 9166.5. Samples: 45468556. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:43,996][744089] Avg episode reward: [(0, '510.228')]
+[2023-03-09 15:53:44,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000088824_45477888.pth...
+[2023-03-09 15:53:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000088288_45203456.pth
+[2023-03-09 15:53:47,203][744402] Updated weights for policy 0, policy_version 88880 (0.0005)
+[2023-03-09 15:53:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 45522944. Throughput: 0: 9097.8. Samples: 45522412. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:53:48,995][744089] Avg episode reward: [(0, '510.387')]
+[2023-03-09 15:53:51,645][744402] Updated weights for policy 0, policy_version 88960 (0.0005)
+[2023-03-09 15:53:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 45568000. Throughput: 0: 9086.8. Samples: 45549180. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:53:53,996][744089] Avg episode reward: [(0, '483.442')]
+[2023-03-09 15:53:56,135][744402] Updated weights for policy 0, policy_version 89040 (0.0005)
+[2023-03-09 15:53:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 45613056. Throughput: 0: 9104.8. Samples: 45604088. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:53:58,996][744089] Avg episode reward: [(0, '520.415')]
+[2023-03-09 15:53:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000089088_45613056.pth...
+[2023-03-09 15:53:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000088560_45342720.pth
+[2023-03-09 15:54:00,914][744402] Updated weights for policy 0, policy_version 89120 (0.0005)
+[2023-03-09 15:54:03,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9011.2, 300 sec: 9150.0). Total num frames: 45654016. Throughput: 0: 8943.1. Samples: 45655048. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:03,995][744089] Avg episode reward: [(0, '517.518')]
+[2023-03-09 15:54:05,450][744402] Updated weights for policy 0, policy_version 89200 (0.0005)
+[2023-03-09 15:54:08,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9011.2, 300 sec: 9150.1). Total num frames: 45699072. Throughput: 0: 8914.5. Samples: 45682496. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:08,995][744089] Avg episode reward: [(0, '528.012')]
+[2023-03-09 15:54:08,996][744358] Saving new best policy, reward=528.012!
+[2023-03-09 15:54:10,179][744402] Updated weights for policy 0, policy_version 89280 (0.0004)
+[2023-03-09 15:54:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9150.0). Total num frames: 45744128. Throughput: 0: 8935.8. Samples: 45735772. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:13,996][744089] Avg episode reward: [(0, '520.798')]
+[2023-03-09 15:54:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000089344_45744128.pth...
+[2023-03-09 15:54:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000088824_45477888.pth
+[2023-03-09 15:54:14,770][744402] Updated weights for policy 0, policy_version 89360 (0.0006)
+[2023-03-09 15:54:18,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8874.7, 300 sec: 9136.2). Total num frames: 45785088. Throughput: 0: 8876.0. Samples: 45786752. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:18,995][744089] Avg episode reward: [(0, '507.353')]
+[2023-03-09 15:54:19,601][744402] Updated weights for policy 0, policy_version 89440 (0.0005)
+[2023-03-09 15:54:23,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8874.7, 300 sec: 9122.3). Total num frames: 45830144. Throughput: 0: 8905.1. Samples: 45813500. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:23,996][744089] Avg episode reward: [(0, '486.583')]
+[2023-03-09 15:54:24,253][744402] Updated weights for policy 0, policy_version 89520 (0.0005)
+[2023-03-09 15:54:28,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8806.4, 300 sec: 9108.4). Total num frames: 45871104. Throughput: 0: 8829.3. Samples: 45865872. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:28,996][744089] Avg episode reward: [(0, '494.295')]
+[2023-03-09 15:54:29,007][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000089600_45875200.pth...
+[2023-03-09 15:54:29,007][744402] Updated weights for policy 0, policy_version 89600 (0.0005)
+[2023-03-09 15:54:29,009][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000089088_45613056.pth
+[2023-03-09 15:54:33,414][744402] Updated weights for policy 0, policy_version 89680 (0.0004)
+[2023-03-09 15:54:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8874.7, 300 sec: 9122.3). Total num frames: 45920256. Throughput: 0: 8840.2. Samples: 45920220. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:33,995][744089] Avg episode reward: [(0, '498.392')]
+[2023-03-09 15:54:38,036][744402] Updated weights for policy 0, policy_version 89760 (0.0005)
+[2023-03-09 15:54:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 8874.7, 300 sec: 9122.3). Total num frames: 45965312. Throughput: 0: 8835.1. Samples: 45946760. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:38,995][744089] Avg episode reward: [(0, '512.206')]
+[2023-03-09 15:54:42,216][744402] Updated weights for policy 0, policy_version 89840 (0.0005)
+[2023-03-09 15:54:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 8942.9, 300 sec: 9136.2). Total num frames: 46014464. Throughput: 0: 8881.0. Samples: 46003732. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:54:43,996][744089] Avg episode reward: [(0, '507.428')]
+[2023-03-09 15:54:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000089872_46014464.pth...
+[2023-03-09 15:54:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000089344_45744128.pth
+[2023-03-09 15:54:46,661][744402] Updated weights for policy 0, policy_version 89920 (0.0005)
+[2023-03-09 15:54:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 8942.9, 300 sec: 9136.2). Total num frames: 46059520. Throughput: 0: 8988.0. Samples: 46059508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:54:48,995][744089] Avg episode reward: [(0, '506.841')]
+[2023-03-09 15:54:51,214][744402] Updated weights for policy 0, policy_version 90000 (0.0005)
+[2023-03-09 15:54:53,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8874.7, 300 sec: 9122.3). Total num frames: 46100480. Throughput: 0: 8940.5. Samples: 46084820. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:54:53,995][744089] Avg episode reward: [(0, '507.222')]
+[2023-03-09 15:54:55,767][744402] Updated weights for policy 0, policy_version 90080 (0.0005)
+[2023-03-09 15:54:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9122.3). Total num frames: 46149632. Throughput: 0: 9013.6. Samples: 46141384. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:54:58,996][744089] Avg episode reward: [(0, '501.494')]
+[2023-03-09 15:54:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000090136_46149632.pth...
+[2023-03-09 15:54:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000089600_45875200.pth
+[2023-03-09 15:55:00,103][744402] Updated weights for policy 0, policy_version 90160 (0.0004)
+[2023-03-09 15:55:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 46194688. Throughput: 0: 9070.9. Samples: 46194944. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:03,996][744089] Avg episode reward: [(0, '504.904')]
+[2023-03-09 15:55:04,632][744402] Updated weights for policy 0, policy_version 90240 (0.0005)
+[2023-03-09 15:55:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 46239744. Throughput: 0: 9109.4. Samples: 46223424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:08,996][744089] Avg episode reward: [(0, '501.433')]
+[2023-03-09 15:55:09,233][744402] Updated weights for policy 0, policy_version 90320 (0.0005)
+[2023-03-09 15:55:13,619][744402] Updated weights for policy 0, policy_version 90400 (0.0005)
+[2023-03-09 15:55:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 46288896. Throughput: 0: 9129.1. Samples: 46276680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:13,995][744089] Avg episode reward: [(0, '503.481')]
+[2023-03-09 15:55:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000090408_46288896.pth...
+[2023-03-09 15:55:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000089872_46014464.pth
+[2023-03-09 15:55:18,134][744402] Updated weights for policy 0, policy_version 90480 (0.0005)
+[2023-03-09 15:55:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 46329856. Throughput: 0: 9144.4. Samples: 46331720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:18,995][744089] Avg episode reward: [(0, '348.848')]
+[2023-03-09 15:55:22,483][744402] Updated weights for policy 0, policy_version 90560 (0.0005)
+[2023-03-09 15:55:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 46379008. Throughput: 0: 9181.0. Samples: 46359904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:23,995][744089] Avg episode reward: [(0, '494.705')]
+[2023-03-09 15:55:26,824][744402] Updated weights for policy 0, policy_version 90640 (0.0005)
+[2023-03-09 15:55:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 46424064. Throughput: 0: 9176.5. Samples: 46416676. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:28,995][744089] Avg episode reward: [(0, '514.499')]
+[2023-03-09 15:55:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000090672_46424064.pth...
+[2023-03-09 15:55:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000090136_46149632.pth
+[2023-03-09 15:55:31,401][744402] Updated weights for policy 0, policy_version 90720 (0.0005)
+[2023-03-09 15:55:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9122.3). Total num frames: 46469120. Throughput: 0: 9129.3. Samples: 46470324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:33,995][744089] Avg episode reward: [(0, '485.403')]
+[2023-03-09 15:55:35,855][744402] Updated weights for policy 0, policy_version 90800 (0.0005)
+[2023-03-09 15:55:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 46518272. Throughput: 0: 9178.6. Samples: 46497856. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:38,995][744089] Avg episode reward: [(0, '498.433')]
+[2023-03-09 15:55:40,441][744402] Updated weights for policy 0, policy_version 90880 (0.0005)
+[2023-03-09 15:55:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 46559232. Throughput: 0: 9103.5. Samples: 46551040. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:43,996][744089] Avg episode reward: [(0, '467.120')]
+[2023-03-09 15:55:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000090936_46559232.pth...
+[2023-03-09 15:55:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000090408_46288896.pth
+[2023-03-09 15:55:45,118][744402] Updated weights for policy 0, policy_version 90960 (0.0004)
+[2023-03-09 15:55:48,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9122.3). Total num frames: 46604288. Throughput: 0: 9098.0. Samples: 46604352. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:48,995][744089] Avg episode reward: [(0, '496.679')]
+[2023-03-09 15:55:49,724][744402] Updated weights for policy 0, policy_version 91040 (0.0005)
+[2023-03-09 15:55:53,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.4, 300 sec: 9108.4). Total num frames: 46645248. Throughput: 0: 9046.0. Samples: 46630496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:53,996][744089] Avg episode reward: [(0, '503.577')]
+[2023-03-09 15:55:54,536][744402] Updated weights for policy 0, policy_version 91120 (0.0005)
+[2023-03-09 15:55:58,995][744089] Fps is (10 sec: 8192.0, 60 sec: 8942.9, 300 sec: 9094.5). Total num frames: 46686208. Throughput: 0: 8981.2. Samples: 46680832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:55:58,995][744089] Avg episode reward: [(0, '496.737')]
+[2023-03-09 15:55:58,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000091184_46686208.pth...
+[2023-03-09 15:55:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000090672_46424064.pth
+[2023-03-09 15:55:59,524][744402] Updated weights for policy 0, policy_version 91200 (0.0005)
+[2023-03-09 15:56:03,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9094.5). Total num frames: 46731264. Throughput: 0: 8915.7. Samples: 46732928. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:03,995][744089] Avg episode reward: [(0, '497.478')]
+[2023-03-09 15:56:04,083][744402] Updated weights for policy 0, policy_version 91280 (0.0005)
+[2023-03-09 15:56:08,665][744402] Updated weights for policy 0, policy_version 91360 (0.0005)
+[2023-03-09 15:56:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9094.5). Total num frames: 46776320. Throughput: 0: 8891.2. Samples: 46760008. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:08,995][744089] Avg episode reward: [(0, '484.907')]
+[2023-03-09 15:56:12,985][744402] Updated weights for policy 0, policy_version 91440 (0.0005)
+[2023-03-09 15:56:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 46825472. Throughput: 0: 8884.8. Samples: 46816492. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:13,995][744089] Avg episode reward: [(0, '515.728')]
+[2023-03-09 15:56:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000091456_46825472.pth...
+[2023-03-09 15:56:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000090936_46559232.pth
+[2023-03-09 15:56:17,642][744402] Updated weights for policy 0, policy_version 91520 (0.0005)
+[2023-03-09 15:56:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9080.6). Total num frames: 46866432. Throughput: 0: 8846.3. Samples: 46868408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:18,995][744089] Avg episode reward: [(0, '510.107')]
+[2023-03-09 15:56:22,274][744402] Updated weights for policy 0, policy_version 91600 (0.0006)
+[2023-03-09 15:56:23,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8874.7, 300 sec: 9080.6). Total num frames: 46911488. Throughput: 0: 8827.7. Samples: 46895104. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:23,995][744089] Avg episode reward: [(0, '488.058')]
+[2023-03-09 15:56:26,979][744402] Updated weights for policy 0, policy_version 91680 (0.0005)
+[2023-03-09 15:56:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8874.7, 300 sec: 9080.6). Total num frames: 46956544. Throughput: 0: 8823.7. Samples: 46948108. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:28,996][744089] Avg episode reward: [(0, '496.642')]
+[2023-03-09 15:56:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000091712_46956544.pth...
+[2023-03-09 15:56:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000091184_46686208.pth
+[2023-03-09 15:56:31,488][744402] Updated weights for policy 0, policy_version 91760 (0.0005)
+[2023-03-09 15:56:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8874.7, 300 sec: 9080.6). Total num frames: 47001600. Throughput: 0: 8825.0. Samples: 47001476. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:33,996][744089] Avg episode reward: [(0, '490.746')]
+[2023-03-09 15:56:36,213][744402] Updated weights for policy 0, policy_version 91840 (0.0005)
+[2023-03-09 15:56:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8806.4, 300 sec: 9066.7). Total num frames: 47046656. Throughput: 0: 8810.2. Samples: 47026952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:38,995][744089] Avg episode reward: [(0, '486.920')]
+[2023-03-09 15:56:40,953][744402] Updated weights for policy 0, policy_version 91920 (0.0005)
+[2023-03-09 15:56:43,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8806.4, 300 sec: 9052.9). Total num frames: 47087616. Throughput: 0: 8857.6. Samples: 47079424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:44,006][744089] Avg episode reward: [(0, '459.639')]
+[2023-03-09 15:56:44,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000091968_47087616.pth...
+[2023-03-09 15:56:44,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000091456_46825472.pth
+[2023-03-09 15:56:45,599][744402] Updated weights for policy 0, policy_version 92000 (0.0005)
+[2023-03-09 15:56:48,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8806.4, 300 sec: 9052.9). Total num frames: 47132672. Throughput: 0: 8884.6. Samples: 47132736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:49,006][744089] Avg episode reward: [(0, '490.711')]
+[2023-03-09 15:56:50,030][744402] Updated weights for policy 0, policy_version 92080 (0.0004)
+[2023-03-09 15:56:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8874.7, 300 sec: 9066.7). Total num frames: 47177728. Throughput: 0: 8920.0. Samples: 47161408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:53,995][744089] Avg episode reward: [(0, '488.183')]
+[2023-03-09 15:56:54,562][744402] Updated weights for policy 0, policy_version 92160 (0.0005)
+[2023-03-09 15:56:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 9052.9). Total num frames: 47222784. Throughput: 0: 8873.9. Samples: 47215820. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:56:58,995][744089] Avg episode reward: [(0, '518.115')]
+[2023-03-09 15:56:59,020][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000092240_47226880.pth...
+[2023-03-09 15:56:59,020][744402] Updated weights for policy 0, policy_version 92240 (0.0005)
+[2023-03-09 15:56:59,022][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000091712_46956544.pth
+[2023-03-09 15:57:03,441][744402] Updated weights for policy 0, policy_version 92320 (0.0005)
+[2023-03-09 15:57:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9052.9). Total num frames: 47271936. Throughput: 0: 8962.5. Samples: 47271720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:03,995][744089] Avg episode reward: [(0, '436.732')]
+[2023-03-09 15:57:08,253][744402] Updated weights for policy 0, policy_version 92400 (0.0004)
+[2023-03-09 15:57:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8942.9, 300 sec: 9039.0). Total num frames: 47312896. Throughput: 0: 8921.6. Samples: 47296576. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:08,995][744089] Avg episode reward: [(0, '442.281')]
+[2023-03-09 15:57:12,731][744402] Updated weights for policy 0, policy_version 92480 (0.0005)
+[2023-03-09 15:57:13,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8874.7, 300 sec: 9025.1). Total num frames: 47357952. Throughput: 0: 8934.2. Samples: 47350148. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:13,995][744089] Avg episode reward: [(0, '447.726')]
+[2023-03-09 15:57:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000092496_47357952.pth...
+[2023-03-09 15:57:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000091968_47087616.pth
+[2023-03-09 15:57:17,642][744402] Updated weights for policy 0, policy_version 92560 (0.0005)
+[2023-03-09 15:57:18,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8874.7, 300 sec: 9011.2). Total num frames: 47398912. Throughput: 0: 8873.5. Samples: 47400784. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:18,995][744089] Avg episode reward: [(0, '452.277')]
+[2023-03-09 15:57:22,267][744402] Updated weights for policy 0, policy_version 92640 (0.0005)
+[2023-03-09 15:57:23,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8874.7, 300 sec: 8997.3). Total num frames: 47443968. Throughput: 0: 8904.6. Samples: 47427660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:23,996][744089] Avg episode reward: [(0, '478.126')]
+[2023-03-09 15:57:27,055][744402] Updated weights for policy 0, policy_version 92720 (0.0005)
+[2023-03-09 15:57:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8874.7, 300 sec: 8997.3). Total num frames: 47489024. Throughput: 0: 8909.6. Samples: 47480356. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:28,995][744089] Avg episode reward: [(0, '453.661')]
+[2023-03-09 15:57:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000092752_47489024.pth...
+[2023-03-09 15:57:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000092240_47226880.pth
+[2023-03-09 15:57:31,627][744402] Updated weights for policy 0, policy_version 92800 (0.0005)
+[2023-03-09 15:57:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 8997.3). Total num frames: 47534080. Throughput: 0: 8911.3. Samples: 47533744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:33,995][744089] Avg episode reward: [(0, '462.483')]
+[2023-03-09 15:57:36,098][744402] Updated weights for policy 0, policy_version 92880 (0.0004)
+[2023-03-09 15:57:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.6, 300 sec: 8983.4). Total num frames: 47579136. Throughput: 0: 8879.1. Samples: 47560968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:38,996][744089] Avg episode reward: [(0, '469.804')]
+[2023-03-09 15:57:40,775][744402] Updated weights for policy 0, policy_version 92960 (0.0004)
+[2023-03-09 15:57:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8943.0, 300 sec: 8983.4). Total num frames: 47624192. Throughput: 0: 8885.7. Samples: 47615676. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:43,995][744089] Avg episode reward: [(0, '455.440')]
+[2023-03-09 15:57:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000093016_47624192.pth...
+[2023-03-09 15:57:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000092496_47357952.pth
+[2023-03-09 15:57:45,287][744402] Updated weights for policy 0, policy_version 93040 (0.0004)
+[2023-03-09 15:57:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 8983.4). Total num frames: 47669248. Throughput: 0: 8822.2. Samples: 47668720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:48,995][744089] Avg episode reward: [(0, '485.658')]
+[2023-03-09 15:57:49,934][744402] Updated weights for policy 0, policy_version 93120 (0.0005)
+[2023-03-09 15:57:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 8983.4). Total num frames: 47714304. Throughput: 0: 8831.4. Samples: 47693988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:53,995][744089] Avg episode reward: [(0, '439.100')]
+[2023-03-09 15:57:54,299][744402] Updated weights for policy 0, policy_version 93200 (0.0005)
+[2023-03-09 15:57:58,181][744402] Updated weights for policy 0, policy_version 93280 (0.0005)
+[2023-03-09 15:57:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 8983.4). Total num frames: 47763456. Throughput: 0: 9004.2. Samples: 47755336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:57:58,995][744089] Avg episode reward: [(0, '475.209')]
+[2023-03-09 15:57:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000093288_47763456.pth...
+[2023-03-09 15:57:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000092752_47489024.pth
+[2023-03-09 15:58:02,739][744402] Updated weights for policy 0, policy_version 93360 (0.0005)
+[2023-03-09 15:58:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 8942.9, 300 sec: 8983.4). Total num frames: 47808512. Throughput: 0: 9114.7. Samples: 47810944. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:58:03,995][744089] Avg episode reward: [(0, '505.384')]
+[2023-03-09 15:58:06,919][744402] Updated weights for policy 0, policy_version 93440 (0.0005)
+[2023-03-09 15:58:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 8997.3). Total num frames: 47857664. Throughput: 0: 9174.6. Samples: 47840516. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:58:08,995][744089] Avg episode reward: [(0, '513.538')]
+[2023-03-09 15:58:11,186][744402] Updated weights for policy 0, policy_version 93520 (0.0005)
+[2023-03-09 15:58:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9147.7, 300 sec: 8997.3). Total num frames: 47906816. Throughput: 0: 9296.3. Samples: 47898688. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:58:13,995][744089] Avg episode reward: [(0, '512.516')]
+[2023-03-09 15:58:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000093568_47906816.pth...
+[2023-03-09 15:58:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000093016_47624192.pth
+[2023-03-09 15:58:15,322][744402] Updated weights for policy 0, policy_version 93600 (0.0005)
+[2023-03-09 15:58:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9284.3, 300 sec: 9011.2). Total num frames: 47955968. Throughput: 0: 9382.8. Samples: 47955968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:58:18,995][744089] Avg episode reward: [(0, '490.006')]
+[2023-03-09 15:58:19,763][744402] Updated weights for policy 0, policy_version 93680 (0.0006)
+[2023-03-09 15:58:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9011.2). Total num frames: 48001024. Throughput: 0: 9385.2. Samples: 47983300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:58:23,995][744089] Avg episode reward: [(0, '464.831')]
+[2023-03-09 15:58:24,222][744402] Updated weights for policy 0, policy_version 93760 (0.0005)
+[2023-03-09 15:58:28,835][744402] Updated weights for policy 0, policy_version 93840 (0.0005)
+[2023-03-09 15:58:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9284.3, 300 sec: 9011.2). Total num frames: 48046080. Throughput: 0: 9367.2. Samples: 48037200. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:58:29,006][744089] Avg episode reward: [(0, '444.056')]
+[2023-03-09 15:58:29,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000093840_48046080.pth...
+[2023-03-09 15:58:29,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000093288_47763456.pth
+[2023-03-09 15:58:33,386][744402] Updated weights for policy 0, policy_version 93920 (0.0005)
+[2023-03-09 15:58:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9011.2). Total num frames: 48091136. Throughput: 0: 9385.8. Samples: 48091080. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:58:33,996][744089] Avg episode reward: [(0, '465.040')]
+[2023-03-09 15:58:37,599][744402] Updated weights for policy 0, policy_version 94000 (0.0005)
+[2023-03-09 15:58:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9025.1). Total num frames: 48140288. Throughput: 0: 9484.9. Samples: 48120808. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:58:38,995][744089] Avg episode reward: [(0, '448.265')]
+[2023-03-09 15:58:42,042][744402] Updated weights for policy 0, policy_version 94080 (0.0005)
+[2023-03-09 15:58:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9025.1). Total num frames: 48185344. Throughput: 0: 9372.1. Samples: 48177080. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:58:43,995][744089] Avg episode reward: [(0, '448.985')]
+[2023-03-09 15:58:44,026][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000094120_48189440.pth...
+[2023-03-09 15:58:44,027][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000093568_47906816.pth
+[2023-03-09 15:58:46,219][744402] Updated weights for policy 0, policy_version 94160 (0.0005)
+[2023-03-09 15:58:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9039.0). Total num frames: 48234496. Throughput: 0: 9394.9. Samples: 48233716. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:58:48,995][744089] Avg episode reward: [(0, '455.353')]
+[2023-03-09 15:58:50,780][744402] Updated weights for policy 0, policy_version 94240 (0.0005)
+[2023-03-09 15:58:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9039.0). Total num frames: 48279552. Throughput: 0: 9318.3. Samples: 48259840. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:58:53,996][744089] Avg episode reward: [(0, '468.107')]
+[2023-03-09 15:58:55,075][744402] Updated weights for policy 0, policy_version 94320 (0.0005)
+[2023-03-09 15:58:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9352.5, 300 sec: 9052.9). Total num frames: 48324608. Throughput: 0: 9281.9. Samples: 48316376. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:58:58,995][744089] Avg episode reward: [(0, '487.936')]
+[2023-03-09 15:58:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000094384_48324608.pth...
+[2023-03-09 15:58:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000093840_48046080.pth
+[2023-03-09 15:58:59,611][744402] Updated weights for policy 0, policy_version 94400 (0.0004)
+[2023-03-09 15:59:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9052.9). Total num frames: 48369664. Throughput: 0: 9206.6. Samples: 48370264. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:59:03,995][744089] Avg episode reward: [(0, '494.848')]
+[2023-03-09 15:59:04,178][744402] Updated weights for policy 0, policy_version 94480 (0.0005)
+[2023-03-09 15:59:08,599][744402] Updated weights for policy 0, policy_version 94560 (0.0005)
+[2023-03-09 15:59:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9052.9). Total num frames: 48414720. Throughput: 0: 9220.0. Samples: 48398200. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:59:08,996][744089] Avg episode reward: [(0, '490.724')]
+[2023-03-09 15:59:13,502][744402] Updated weights for policy 0, policy_version 94640 (0.0004)
+[2023-03-09 15:59:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9066.7). Total num frames: 48459776. Throughput: 0: 9182.7. Samples: 48450420. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:59:13,996][744089] Avg episode reward: [(0, '519.684')]
+[2023-03-09 15:59:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000094648_48459776.pth...
+[2023-03-09 15:59:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000094120_48189440.pth
+[2023-03-09 15:59:17,735][744402] Updated weights for policy 0, policy_version 94720 (0.0005)
+[2023-03-09 15:59:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 48508928. Throughput: 0: 9284.3. Samples: 48508872. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:59:18,995][744089] Avg episode reward: [(0, '516.192')]
+[2023-03-09 15:59:21,912][744402] Updated weights for policy 0, policy_version 94800 (0.0005)
+[2023-03-09 15:59:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9284.3, 300 sec: 9108.4). Total num frames: 48558080. Throughput: 0: 9240.5. Samples: 48536632. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 15:59:24,006][744089] Avg episode reward: [(0, '452.755')]
+[2023-03-09 15:59:26,272][744402] Updated weights for policy 0, policy_version 94880 (0.0005)
+[2023-03-09 15:59:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9094.5). Total num frames: 48603136. Throughput: 0: 9249.6. Samples: 48593312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:59:28,996][744089] Avg episode reward: [(0, '516.670')]
+[2023-03-09 15:59:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000094928_48603136.pth...
+[2023-03-09 15:59:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000094384_48324608.pth
+[2023-03-09 15:59:30,576][744402] Updated weights for policy 0, policy_version 94960 (0.0005)
+[2023-03-09 15:59:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9094.5). Total num frames: 48648192. Throughput: 0: 9208.1. Samples: 48648080. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:59:33,995][744089] Avg episode reward: [(0, '506.514')]
+[2023-03-09 15:59:35,296][744402] Updated weights for policy 0, policy_version 95040 (0.0005)
+[2023-03-09 15:59:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 48693248. Throughput: 0: 9234.8. Samples: 48675408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:59:38,996][744089] Avg episode reward: [(0, '487.366')]
+[2023-03-09 15:59:39,746][744402] Updated weights for policy 0, policy_version 95120 (0.0005)
+[2023-03-09 15:59:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9080.6). Total num frames: 48738304. Throughput: 0: 9192.7. Samples: 48730048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:59:44,006][744089] Avg episode reward: [(0, '477.094')]
+[2023-03-09 15:59:44,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000095192_48738304.pth...
+[2023-03-09 15:59:44,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000094648_48459776.pth
+[2023-03-09 15:59:44,226][744402] Updated weights for policy 0, policy_version 95200 (0.0005)
+[2023-03-09 15:59:48,511][744402] Updated weights for policy 0, policy_version 95280 (0.0004)
+[2023-03-09 15:59:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 48787456. Throughput: 0: 9256.9. Samples: 48786824. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:59:48,995][744089] Avg episode reward: [(0, '474.121')]
+[2023-03-09 15:59:52,914][744402] Updated weights for policy 0, policy_version 95360 (0.0005)
+[2023-03-09 15:59:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9094.5). Total num frames: 48832512. Throughput: 0: 9248.7. Samples: 48814392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:59:53,995][744089] Avg episode reward: [(0, '452.610')]
+[2023-03-09 15:59:57,331][744402] Updated weights for policy 0, policy_version 95440 (0.0005)
+[2023-03-09 15:59:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9094.5). Total num frames: 48877568. Throughput: 0: 9311.8. Samples: 48869448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 15:59:58,995][744089] Avg episode reward: [(0, '459.580')]
+[2023-03-09 15:59:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000095464_48877568.pth...
+[2023-03-09 15:59:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000094928_48603136.pth
+[2023-03-09 16:00:01,683][744402] Updated weights for policy 0, policy_version 95520 (0.0005)
+[2023-03-09 16:00:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9094.5). Total num frames: 48922624. Throughput: 0: 9223.2. Samples: 48923916. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:00:03,995][744089] Avg episode reward: [(0, '431.584')]
+[2023-03-09 16:00:06,377][744402] Updated weights for policy 0, policy_version 95600 (0.0004)
+[2023-03-09 16:00:08,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9094.5). Total num frames: 48971776. Throughput: 0: 9216.2. Samples: 48951360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:00:08,996][744089] Avg episode reward: [(0, '494.419')]
+[2023-03-09 16:00:10,426][744402] Updated weights for policy 0, policy_version 95680 (0.0005)
+[2023-03-09 16:00:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9352.5, 300 sec: 9122.3). Total num frames: 49020928. Throughput: 0: 9255.6. Samples: 49009812. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:00:13,995][744089] Avg episode reward: [(0, '449.728')]
+[2023-03-09 16:00:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000095744_49020928.pth...
+[2023-03-09 16:00:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000095192_48738304.pth
+[2023-03-09 16:00:14,797][744402] Updated weights for policy 0, policy_version 95760 (0.0005)
+[2023-03-09 16:00:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9108.4). Total num frames: 49065984. Throughput: 0: 9313.4. Samples: 49067184. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:00:18,995][744089] Avg episode reward: [(0, '476.354')]
+[2023-03-09 16:00:19,123][744402] Updated weights for policy 0, policy_version 95840 (0.0005)
+[2023-03-09 16:00:23,677][744402] Updated weights for policy 0, policy_version 95920 (0.0005)
+[2023-03-09 16:00:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9108.4). Total num frames: 49111040. Throughput: 0: 9312.6. Samples: 49094476. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:00:23,995][744089] Avg episode reward: [(0, '506.086')]
+[2023-03-09 16:00:28,122][744402] Updated weights for policy 0, policy_version 96000 (0.0004)
+[2023-03-09 16:00:28,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9284.3, 300 sec: 9122.3). Total num frames: 49160192. Throughput: 0: 9287.6. Samples: 49147992. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:00:28,996][744089] Avg episode reward: [(0, '482.862')]
+[2023-03-09 16:00:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000096016_49160192.pth...
+[2023-03-09 16:00:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000095464_48877568.pth
+[2023-03-09 16:00:32,496][744402] Updated weights for policy 0, policy_version 96080 (0.0005)
+[2023-03-09 16:00:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9108.4). Total num frames: 49205248. Throughput: 0: 9301.2. Samples: 49205380. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:00:33,996][744089] Avg episode reward: [(0, '517.544')]
+[2023-03-09 16:00:37,017][744402] Updated weights for policy 0, policy_version 96160 (0.0004)
+[2023-03-09 16:00:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9284.3, 300 sec: 9122.3). Total num frames: 49250304. Throughput: 0: 9285.6. Samples: 49232244. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:00:39,006][744089] Avg episode reward: [(0, '510.177')]
+[2023-03-09 16:00:41,676][744402] Updated weights for policy 0, policy_version 96240 (0.0005)
+[2023-03-09 16:00:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9122.3). Total num frames: 49295360. Throughput: 0: 9257.6. Samples: 49286040. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:00:43,996][744089] Avg episode reward: [(0, '492.076')]
+[2023-03-09 16:00:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000096280_49295360.pth...
+[2023-03-09 16:00:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000095744_49020928.pth
+[2023-03-09 16:00:46,243][744402] Updated weights for policy 0, policy_version 96320 (0.0005)
+[2023-03-09 16:00:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9136.2). Total num frames: 49340416. Throughput: 0: 9239.8. Samples: 49339708. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:00:48,995][744089] Avg episode reward: [(0, '508.421')]
+[2023-03-09 16:00:50,733][744402] Updated weights for policy 0, policy_version 96400 (0.0005)
+[2023-03-09 16:00:53,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 49385472. Throughput: 0: 9224.6. Samples: 49366468. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:00:53,996][744089] Avg episode reward: [(0, '490.979')]
+[2023-03-09 16:00:55,162][744402] Updated weights for policy 0, policy_version 96480 (0.0005)
+[2023-03-09 16:00:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 49430528. Throughput: 0: 9168.8. Samples: 49422408. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:00:58,996][744089] Avg episode reward: [(0, '488.518')]
+[2023-03-09 16:00:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000096544_49430528.pth...
+[2023-03-09 16:00:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000096016_49160192.pth
+[2023-03-09 16:00:59,760][744402] Updated weights for policy 0, policy_version 96560 (0.0005)
+[2023-03-09 16:01:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9150.0). Total num frames: 49475584. Throughput: 0: 9077.0. Samples: 49475648. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:01:03,995][744089] Avg episode reward: [(0, '498.786')]
+[2023-03-09 16:01:04,265][744402] Updated weights for policy 0, policy_version 96640 (0.0005)
+[2023-03-09 16:01:08,690][744402] Updated weights for policy 0, policy_version 96720 (0.0005)
+[2023-03-09 16:01:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9136.2). Total num frames: 49520640. Throughput: 0: 9105.5. Samples: 49504224. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:01:08,995][744089] Avg episode reward: [(0, '466.534')]
+[2023-03-09 16:01:13,061][744402] Updated weights for policy 0, policy_version 96800 (0.0005)
+[2023-03-09 16:01:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 49569792. Throughput: 0: 9136.5. Samples: 49559136. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:01:13,995][744089] Avg episode reward: [(0, '366.922')]
+[2023-03-09 16:01:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000096816_49569792.pth...
+[2023-03-09 16:01:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000096280_49295360.pth
+[2023-03-09 16:01:17,476][744402] Updated weights for policy 0, policy_version 96880 (0.0005)
+[2023-03-09 16:01:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9163.9). Total num frames: 49614848. Throughput: 0: 9118.4. Samples: 49615708. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:01:18,995][744089] Avg episode reward: [(0, '154.598')]
+[2023-03-09 16:01:21,658][744402] Updated weights for policy 0, policy_version 96960 (0.0005)
+[2023-03-09 16:01:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9177.8). Total num frames: 49664000. Throughput: 0: 9176.0. Samples: 49645164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:01:23,995][744089] Avg episode reward: [(0, '440.560')]
+[2023-03-09 16:01:26,041][744402] Updated weights for policy 0, policy_version 97040 (0.0005)
+[2023-03-09 16:01:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 49709056. Throughput: 0: 9211.2. Samples: 49700544. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:01:28,996][744089] Avg episode reward: [(0, '479.391')]
+[2023-03-09 16:01:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000097088_49709056.pth...
+[2023-03-09 16:01:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000096544_49430528.pth
+[2023-03-09 16:01:30,634][744402] Updated weights for policy 0, policy_version 97120 (0.0005)
+[2023-03-09 16:01:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 49754112. Throughput: 0: 9208.7. Samples: 49754100. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:01:33,995][744089] Avg episode reward: [(0, '496.828')]
+[2023-03-09 16:01:35,158][744402] Updated weights for policy 0, policy_version 97200 (0.0005)
+[2023-03-09 16:01:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 49799168. Throughput: 0: 9190.0. Samples: 49780020. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:01:38,995][744089] Avg episode reward: [(0, '504.601')]
+[2023-03-09 16:01:39,840][744402] Updated weights for policy 0, policy_version 97280 (0.0004)
+[2023-03-09 16:01:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 49844224. Throughput: 0: 9166.7. Samples: 49834908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:01:43,996][744089] Avg episode reward: [(0, '495.917')]
+[2023-03-09 16:01:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000097352_49844224.pth...
+[2023-03-09 16:01:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000096816_49569792.pth
+[2023-03-09 16:01:44,369][744402] Updated weights for policy 0, policy_version 97360 (0.0005)
+[2023-03-09 16:01:48,712][744402] Updated weights for policy 0, policy_version 97440 (0.0005)
+[2023-03-09 16:01:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 49889280. Throughput: 0: 9211.5. Samples: 49890164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:01:48,995][744089] Avg episode reward: [(0, '484.743')]
+[2023-03-09 16:01:53,001][744402] Updated weights for policy 0, policy_version 97520 (0.0005)
+[2023-03-09 16:01:53,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9216.0, 300 sec: 9205.6). Total num frames: 49938432. Throughput: 0: 9214.1. Samples: 49918856. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:01:53,995][744089] Avg episode reward: [(0, '492.934')]
+[2023-03-09 16:01:57,509][744402] Updated weights for policy 0, policy_version 97600 (0.0005)
+[2023-03-09 16:01:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9191.7). Total num frames: 49983488. Throughput: 0: 9230.4. Samples: 49974504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:01:58,995][744089] Avg episode reward: [(0, '495.208')]
+[2023-03-09 16:01:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000097624_49983488.pth...
+[2023-03-09 16:01:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000097088_49709056.pth
+[2023-03-09 16:02:01,971][744402] Updated weights for policy 0, policy_version 97680 (0.0005)
+[2023-03-09 16:02:03,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9205.6). Total num frames: 50028544. Throughput: 0: 9175.5. Samples: 50028608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:02:03,995][744089] Avg episode reward: [(0, '500.979')]
+[2023-03-09 16:02:06,532][744402] Updated weights for policy 0, policy_version 97760 (0.0004)
+[2023-03-09 16:02:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9205.6). Total num frames: 50073600. Throughput: 0: 9133.5. Samples: 50056172. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:02:08,995][744089] Avg episode reward: [(0, '496.628')]
+[2023-03-09 16:02:10,982][744402] Updated weights for policy 0, policy_version 97840 (0.0004)
+[2023-03-09 16:02:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9219.5). Total num frames: 50118656. Throughput: 0: 9112.5. Samples: 50110608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:02:13,995][744089] Avg episode reward: [(0, '505.490')]
+[2023-03-09 16:02:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000097888_50118656.pth...
+[2023-03-09 16:02:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000097352_49844224.pth
+[2023-03-09 16:02:15,225][744402] Updated weights for policy 0, policy_version 97920 (0.0005)
+[2023-03-09 16:02:18,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9284.3, 300 sec: 9247.2). Total num frames: 50171904. Throughput: 0: 9281.6. Samples: 50171772. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:02:18,995][744089] Avg episode reward: [(0, '492.221')]
+[2023-03-09 16:02:19,393][744402] Updated weights for policy 0, policy_version 98000 (0.0005)
+[2023-03-09 16:02:23,960][744402] Updated weights for policy 0, policy_version 98080 (0.0006)
+[2023-03-09 16:02:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9216.0, 300 sec: 9247.2). Total num frames: 50216960. Throughput: 0: 9299.8. Samples: 50198512. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:02:23,996][744089] Avg episode reward: [(0, '476.200')]
+[2023-03-09 16:02:28,033][744402] Updated weights for policy 0, policy_version 98160 (0.0005)
+[2023-03-09 16:02:28,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9284.3, 300 sec: 9261.1). Total num frames: 50266112. Throughput: 0: 9333.1. Samples: 50254896. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:02:28,996][744089] Avg episode reward: [(0, '479.440')]
+[2023-03-09 16:02:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000098176_50266112.pth...
+[2023-03-09 16:02:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000097624_49983488.pth
+[2023-03-09 16:02:32,685][744402] Updated weights for policy 0, policy_version 98240 (0.0005)
+[2023-03-09 16:02:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9247.2). Total num frames: 50307072. Throughput: 0: 9283.6. Samples: 50307928. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:02:33,995][744089] Avg episode reward: [(0, '475.879')]
+[2023-03-09 16:02:37,287][744402] Updated weights for policy 0, policy_version 98320 (0.0005)
+[2023-03-09 16:02:38,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9216.0, 300 sec: 9247.2). Total num frames: 50352128. Throughput: 0: 9265.6. Samples: 50335808. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:02:38,995][744089] Avg episode reward: [(0, '462.481')]
+[2023-03-09 16:02:41,967][744402] Updated weights for policy 0, policy_version 98400 (0.0005)
+[2023-03-09 16:02:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9247.2). Total num frames: 50397184. Throughput: 0: 9199.8. Samples: 50388496. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:02:43,996][744089] Avg episode reward: [(0, '511.340')]
+[2023-03-09 16:02:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000098432_50397184.pth...
+[2023-03-09 16:02:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000097888_50118656.pth
+[2023-03-09 16:02:46,673][744402] Updated weights for policy 0, policy_version 98480 (0.0005)
+[2023-03-09 16:02:48,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9147.7, 300 sec: 9233.4). Total num frames: 50438144. Throughput: 0: 9143.8. Samples: 50440080. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:02:48,995][744089] Avg episode reward: [(0, '466.680')]
+[2023-03-09 16:02:51,363][744402] Updated weights for policy 0, policy_version 98560 (0.0005)
+[2023-03-09 16:02:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9233.4). Total num frames: 50487296. Throughput: 0: 9126.8. Samples: 50466880. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:02:53,995][744089] Avg episode reward: [(0, '493.026')]
+[2023-03-09 16:02:55,688][744402] Updated weights for policy 0, policy_version 98640 (0.0005)
+[2023-03-09 16:02:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9233.4). Total num frames: 50532352. Throughput: 0: 9191.7. Samples: 50524232. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:02:58,995][744089] Avg episode reward: [(0, '500.056')]
+[2023-03-09 16:02:59,003][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000098704_50536448.pth...
+[2023-03-09 16:02:59,005][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000098176_50266112.pth
+[2023-03-09 16:02:59,951][744402] Updated weights for policy 0, policy_version 98720 (0.0005)
+[2023-03-09 16:03:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9147.7, 300 sec: 9219.5). Total num frames: 50577408. Throughput: 0: 9048.6. Samples: 50578960. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:03:03,995][744089] Avg episode reward: [(0, '490.083')]
+[2023-03-09 16:03:04,516][744402] Updated weights for policy 0, policy_version 98800 (0.0005)
+[2023-03-09 16:03:08,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9205.6). Total num frames: 50622464. Throughput: 0: 9062.9. Samples: 50606344. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:03:08,996][744089] Avg episode reward: [(0, '392.455')]
+[2023-03-09 16:03:09,005][744402] Updated weights for policy 0, policy_version 98880 (0.0005)
+[2023-03-09 16:03:13,644][744402] Updated weights for policy 0, policy_version 98960 (0.0004)
+[2023-03-09 16:03:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 50667520. Throughput: 0: 8989.0. Samples: 50659400. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:03:13,996][744089] Avg episode reward: [(0, '393.464')]
+[2023-03-09 16:03:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000098960_50667520.pth...
+[2023-03-09 16:03:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000098432_50397184.pth
+[2023-03-09 16:03:18,187][744402] Updated weights for policy 0, policy_version 99040 (0.0005)
+[2023-03-09 16:03:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9191.7). Total num frames: 50712576. Throughput: 0: 9017.3. Samples: 50713704. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:03:18,995][744089] Avg episode reward: [(0, '468.358')]
+[2023-03-09 16:03:23,052][744402] Updated weights for policy 0, policy_version 99120 (0.0005)
+[2023-03-09 16:03:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9191.7). Total num frames: 50757632. Throughput: 0: 8965.1. Samples: 50739236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:03:23,995][744089] Avg episode reward: [(0, '414.616')]
+[2023-03-09 16:03:27,639][744402] Updated weights for policy 0, policy_version 99200 (0.0005)
+[2023-03-09 16:03:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 9191.7). Total num frames: 50802688. Throughput: 0: 8961.8. Samples: 50791776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:03:28,996][744089] Avg episode reward: [(0, '369.006')]
+[2023-03-09 16:03:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000099224_50802688.pth...
+[2023-03-09 16:03:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000098704_50536448.pth
+[2023-03-09 16:03:32,170][744402] Updated weights for policy 0, policy_version 99280 (0.0004)
+[2023-03-09 16:03:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 50847744. Throughput: 0: 9056.2. Samples: 50847608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:03:33,995][744089] Avg episode reward: [(0, '451.883')]
+[2023-03-09 16:03:36,640][744402] Updated weights for policy 0, policy_version 99360 (0.0005)
+[2023-03-09 16:03:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9177.8). Total num frames: 50892800. Throughput: 0: 9047.0. Samples: 50873996. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:03:38,996][744089] Avg episode reward: [(0, '476.102')]
+[2023-03-09 16:03:41,028][744402] Updated weights for policy 0, policy_version 99440 (0.0005)
+[2023-03-09 16:03:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9163.9). Total num frames: 50937856. Throughput: 0: 9011.0. Samples: 50929728. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:03:43,995][744089] Avg episode reward: [(0, '493.323')]
+[2023-03-09 16:03:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000099488_50937856.pth...
+[2023-03-09 16:03:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000098960_50667520.pth
+[2023-03-09 16:03:45,329][744402] Updated weights for policy 0, policy_version 99520 (0.0005)
+[2023-03-09 16:03:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 50987008. Throughput: 0: 9069.1. Samples: 50987072. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:03:48,996][744089] Avg episode reward: [(0, '495.253')]
+[2023-03-09 16:03:49,657][744402] Updated weights for policy 0, policy_version 99600 (0.0005)
+[2023-03-09 16:03:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9177.8). Total num frames: 51032064. Throughput: 0: 9097.8. Samples: 51015744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:03:53,995][744089] Avg episode reward: [(0, '470.438')]
+[2023-03-09 16:03:54,007][744402] Updated weights for policy 0, policy_version 99680 (0.0004)
+[2023-03-09 16:03:58,431][744402] Updated weights for policy 0, policy_version 99760 (0.0004)
+[2023-03-09 16:03:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 51081216. Throughput: 0: 9159.6. Samples: 51071584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:03:58,996][744089] Avg episode reward: [(0, '496.934')]
+[2023-03-09 16:03:59,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000099768_51081216.pth...
+[2023-03-09 16:03:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000099224_50802688.pth
+[2023-03-09 16:04:02,949][744402] Updated weights for policy 0, policy_version 99840 (0.0005)
+[2023-03-09 16:04:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 51126272. Throughput: 0: 9168.0. Samples: 51126264. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:03,995][744089] Avg episode reward: [(0, '472.170')]
+[2023-03-09 16:04:07,431][744402] Updated weights for policy 0, policy_version 99920 (0.0005)
+[2023-03-09 16:04:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9147.7, 300 sec: 9191.7). Total num frames: 51171328. Throughput: 0: 9230.3. Samples: 51154600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:08,995][744089] Avg episode reward: [(0, '492.764')]
+[2023-03-09 16:04:12,044][744402] Updated weights for policy 0, policy_version 100000 (0.0004)
+[2023-03-09 16:04:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9147.7, 300 sec: 9177.8). Total num frames: 51216384. Throughput: 0: 9239.5. Samples: 51207552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:13,996][744089] Avg episode reward: [(0, '507.184')]
+[2023-03-09 16:04:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000100032_51216384.pth...
+[2023-03-09 16:04:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000099488_50937856.pth
+[2023-03-09 16:04:16,655][744402] Updated weights for policy 0, policy_version 100080 (0.0006)
+[2023-03-09 16:04:18,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 51257344. Throughput: 0: 9132.1. Samples: 51258552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:18,995][744089] Avg episode reward: [(0, '482.051')]
+[2023-03-09 16:04:21,470][744402] Updated weights for policy 0, policy_version 100160 (0.0005)
+[2023-03-09 16:04:23,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 51302400. Throughput: 0: 9147.1. Samples: 51285616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:23,995][744089] Avg episode reward: [(0, '472.095')]
+[2023-03-09 16:04:26,315][744402] Updated weights for policy 0, policy_version 100240 (0.0005)
+[2023-03-09 16:04:28,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9011.2, 300 sec: 9136.2). Total num frames: 51343360. Throughput: 0: 9021.6. Samples: 51335700. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:28,995][744089] Avg episode reward: [(0, '488.847')]
+[2023-03-09 16:04:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000100280_51343360.pth...
+[2023-03-09 16:04:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000099768_51081216.pth
+[2023-03-09 16:04:30,887][744402] Updated weights for policy 0, policy_version 100320 (0.0006)
+[2023-03-09 16:04:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9150.1). Total num frames: 51392512. Throughput: 0: 9003.2. Samples: 51392216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:33,995][744089] Avg episode reward: [(0, '481.610')]
+[2023-03-09 16:04:35,339][744402] Updated weights for policy 0, policy_version 100400 (0.0005)
+[2023-03-09 16:04:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 51437568. Throughput: 0: 8935.3. Samples: 51417832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:38,996][744089] Avg episode reward: [(0, '503.660')]
+[2023-03-09 16:04:39,917][744402] Updated weights for policy 0, policy_version 100480 (0.0004)
+[2023-03-09 16:04:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9079.5, 300 sec: 9136.2). Total num frames: 51482624. Throughput: 0: 8973.8. Samples: 51475404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:43,996][744089] Avg episode reward: [(0, '498.833')]
+[2023-03-09 16:04:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000100552_51482624.pth...
+[2023-03-09 16:04:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000100032_51216384.pth
+[2023-03-09 16:04:44,101][744402] Updated weights for policy 0, policy_version 100560 (0.0005)
+[2023-03-09 16:04:48,462][744402] Updated weights for policy 0, policy_version 100640 (0.0005)
+[2023-03-09 16:04:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 51531776. Throughput: 0: 9008.4. Samples: 51531644. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:48,995][744089] Avg episode reward: [(0, '479.601')]
+[2023-03-09 16:04:52,943][744402] Updated weights for policy 0, policy_version 100720 (0.0005)
+[2023-03-09 16:04:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9150.0). Total num frames: 51576832. Throughput: 0: 8984.1. Samples: 51558884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:53,995][744089] Avg episode reward: [(0, '480.106')]
+[2023-03-09 16:04:57,795][744402] Updated weights for policy 0, policy_version 100800 (0.0005)
+[2023-03-09 16:04:58,995][744089] Fps is (10 sec: 8601.6, 60 sec: 8942.9, 300 sec: 9136.2). Total num frames: 51617792. Throughput: 0: 8935.8. Samples: 51609664. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:04:58,996][744089] Avg episode reward: [(0, '505.508')]
+[2023-03-09 16:04:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000100816_51617792.pth...
+[2023-03-09 16:04:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000100280_51343360.pth
+[2023-03-09 16:05:02,301][744402] Updated weights for policy 0, policy_version 100880 (0.0005)
+[2023-03-09 16:05:03,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9122.3). Total num frames: 51662848. Throughput: 0: 9034.9. Samples: 51665120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:03,995][744089] Avg episode reward: [(0, '514.855')]
+[2023-03-09 16:05:06,845][744402] Updated weights for policy 0, policy_version 100960 (0.0005)
+[2023-03-09 16:05:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 51707904. Throughput: 0: 9020.1. Samples: 51691520. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:08,996][744089] Avg episode reward: [(0, '499.993')]
+[2023-03-09 16:05:11,500][744402] Updated weights for policy 0, policy_version 101040 (0.0005)
+[2023-03-09 16:05:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 9108.4). Total num frames: 51752960. Throughput: 0: 9091.8. Samples: 51744832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:13,996][744089] Avg episode reward: [(0, '501.126')]
+[2023-03-09 16:05:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000101080_51752960.pth...
+[2023-03-09 16:05:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000100552_51482624.pth
+[2023-03-09 16:05:16,035][744402] Updated weights for policy 0, policy_version 101120 (0.0005)
+[2023-03-09 16:05:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 51798016. Throughput: 0: 9021.3. Samples: 51798176. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:18,996][744089] Avg episode reward: [(0, '488.499')]
+[2023-03-09 16:05:20,519][744402] Updated weights for policy 0, policy_version 101200 (0.0005)
+[2023-03-09 16:05:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 51843072. Throughput: 0: 9082.9. Samples: 51826560. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:23,995][744089] Avg episode reward: [(0, '467.878')]
+[2023-03-09 16:05:25,152][744402] Updated weights for policy 0, policy_version 101280 (0.0005)
+[2023-03-09 16:05:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9094.5). Total num frames: 51888128. Throughput: 0: 8987.1. Samples: 51879824. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:28,996][744089] Avg episode reward: [(0, '463.741')]
+[2023-03-09 16:05:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000101344_51888128.pth...
+[2023-03-09 16:05:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000100816_51617792.pth
+[2023-03-09 16:05:29,550][744402] Updated weights for policy 0, policy_version 101360 (0.0005)
+[2023-03-09 16:05:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 51933184. Throughput: 0: 8944.5. Samples: 51934148. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:33,995][744089] Avg episode reward: [(0, '477.499')]
+[2023-03-09 16:05:34,126][744402] Updated weights for policy 0, policy_version 101440 (0.0005)
+[2023-03-09 16:05:38,577][744402] Updated weights for policy 0, policy_version 101520 (0.0005)
+[2023-03-09 16:05:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 51978240. Throughput: 0: 8960.7. Samples: 51962116. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:38,995][744089] Avg episode reward: [(0, '494.712')]
+[2023-03-09 16:05:42,827][744402] Updated weights for policy 0, policy_version 101600 (0.0005)
+[2023-03-09 16:05:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 52027392. Throughput: 0: 9099.0. Samples: 52019120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:43,996][744089] Avg episode reward: [(0, '500.517')]
+[2023-03-09 16:05:44,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000101616_52027392.pth...
+[2023-03-09 16:05:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000101080_51752960.pth
+[2023-03-09 16:05:47,427][744402] Updated weights for policy 0, policy_version 101680 (0.0005)
+[2023-03-09 16:05:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 52072448. Throughput: 0: 9053.3. Samples: 52072520. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:48,995][744089] Avg episode reward: [(0, '510.619')]
+[2023-03-09 16:05:52,071][744402] Updated weights for policy 0, policy_version 101760 (0.0005)
+[2023-03-09 16:05:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9108.4). Total num frames: 52117504. Throughput: 0: 9055.1. Samples: 52099000. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:53,995][744089] Avg episode reward: [(0, '504.894')]
+[2023-03-09 16:05:56,750][744402] Updated weights for policy 0, policy_version 101840 (0.0005)
+[2023-03-09 16:05:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 9108.4). Total num frames: 52162560. Throughput: 0: 9043.2. Samples: 52151776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:05:58,995][744089] Avg episode reward: [(0, '511.888')]
+[2023-03-09 16:05:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000101880_52162560.pth...
+[2023-03-09 16:05:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000101344_51888128.pth
+[2023-03-09 16:06:01,269][744402] Updated weights for policy 0, policy_version 101920 (0.0005)
+[2023-03-09 16:06:03,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9011.2, 300 sec: 9094.5). Total num frames: 52203520. Throughput: 0: 9030.5. Samples: 52204548. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:06:03,995][744089] Avg episode reward: [(0, '514.365')]
+[2023-03-09 16:06:05,929][744402] Updated weights for policy 0, policy_version 102000 (0.0006)
+[2023-03-09 16:06:08,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 52248576. Throughput: 0: 9002.7. Samples: 52231684. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:06:08,996][744089] Avg episode reward: [(0, '503.022')]
+[2023-03-09 16:06:10,708][744402] Updated weights for policy 0, policy_version 102080 (0.0005)
+[2023-03-09 16:06:13,995][744089] Fps is (10 sec: 9011.0, 60 sec: 9011.2, 300 sec: 9080.6). Total num frames: 52293632. Throughput: 0: 8981.6. Samples: 52283996. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:06:13,996][744089] Avg episode reward: [(0, '474.461')]
+[2023-03-09 16:06:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000102136_52293632.pth...
+[2023-03-09 16:06:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000101616_52027392.pth
+[2023-03-09 16:06:15,442][744402] Updated weights for policy 0, policy_version 102160 (0.0005)
+[2023-03-09 16:06:18,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9052.9). Total num frames: 52334592. Throughput: 0: 8936.2. Samples: 52336276. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:06:18,995][744089] Avg episode reward: [(0, '492.605')]
+[2023-03-09 16:06:20,011][744402] Updated weights for policy 0, policy_version 102240 (0.0005)
+[2023-03-09 16:06:23,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8942.9, 300 sec: 9052.9). Total num frames: 52379648. Throughput: 0: 8921.2. Samples: 52363572. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:06:23,995][744089] Avg episode reward: [(0, '515.123')]
+[2023-03-09 16:06:24,642][744402] Updated weights for policy 0, policy_version 102320 (0.0005)
+[2023-03-09 16:06:28,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8942.9, 300 sec: 9052.8). Total num frames: 52424704. Throughput: 0: 8829.4. Samples: 52416444. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:06:28,996][744089] Avg episode reward: [(0, '517.391')]
+[2023-03-09 16:06:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000102392_52424704.pth...
+[2023-03-09 16:06:29,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000101880_52162560.pth
+[2023-03-09 16:06:29,301][744402] Updated weights for policy 0, policy_version 102400 (0.0005)
+[2023-03-09 16:06:33,934][744402] Updated weights for policy 0, policy_version 102480 (0.0005)
+[2023-03-09 16:06:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 9052.9). Total num frames: 52469760. Throughput: 0: 8819.8. Samples: 52469412. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:06:33,995][744089] Avg episode reward: [(0, '519.261')]
+[2023-03-09 16:06:38,382][744402] Updated weights for policy 0, policy_version 102560 (0.0005)
+[2023-03-09 16:06:38,995][744089] Fps is (10 sec: 9011.3, 60 sec: 8942.9, 300 sec: 9052.9). Total num frames: 52514816. Throughput: 0: 8858.5. Samples: 52497632. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:06:38,995][744089] Avg episode reward: [(0, '511.152')]
+[2023-03-09 16:06:42,968][744402] Updated weights for policy 0, policy_version 102640 (0.0005)
+[2023-03-09 16:06:43,995][744089] Fps is (10 sec: 9011.1, 60 sec: 8874.7, 300 sec: 9052.9). Total num frames: 52559872. Throughput: 0: 8867.9. Samples: 52550832. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:06:43,996][744089] Avg episode reward: [(0, '497.451')]
+[2023-03-09 16:06:44,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000102656_52559872.pth...
+[2023-03-09 16:06:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000102136_52293632.pth
+[2023-03-09 16:06:47,579][744402] Updated weights for policy 0, policy_version 102720 (0.0005)
+[2023-03-09 16:06:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 9039.0). Total num frames: 52604928. Throughput: 0: 8868.4. Samples: 52603628. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:06:48,995][744089] Avg episode reward: [(0, '510.947')]
+[2023-03-09 16:06:52,220][744402] Updated weights for policy 0, policy_version 102800 (0.0005)
+[2023-03-09 16:06:53,995][744089] Fps is (10 sec: 8601.7, 60 sec: 8806.4, 300 sec: 9025.1). Total num frames: 52645888. Throughput: 0: 8843.4. Samples: 52629636. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:06:53,995][744089] Avg episode reward: [(0, '499.496')]
+[2023-03-09 16:06:56,911][744402] Updated weights for policy 0, policy_version 102880 (0.0005)
+[2023-03-09 16:06:58,995][744089] Fps is (10 sec: 8601.5, 60 sec: 8806.4, 300 sec: 9025.1). Total num frames: 52690944. Throughput: 0: 8862.9. Samples: 52682824. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:06:58,996][744089] Avg episode reward: [(0, '497.757')]
+[2023-03-09 16:06:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000102912_52690944.pth...
+[2023-03-09 16:06:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000102392_52424704.pth
+[2023-03-09 16:07:01,431][744402] Updated weights for policy 0, policy_version 102960 (0.0005)
+[2023-03-09 16:07:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.6, 300 sec: 9025.1). Total num frames: 52736000. Throughput: 0: 8891.9. Samples: 52736412. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:07:03,995][744089] Avg episode reward: [(0, '484.639')]
+[2023-03-09 16:07:05,974][744402] Updated weights for policy 0, policy_version 103040 (0.0005)
+[2023-03-09 16:07:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 8874.7, 300 sec: 9025.1). Total num frames: 52781056. Throughput: 0: 8907.3. Samples: 52764400. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:07:08,995][744089] Avg episode reward: [(0, '501.424')]
+[2023-03-09 16:07:10,409][744402] Updated weights for policy 0, policy_version 103120 (0.0004)
+[2023-03-09 16:07:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 8942.9, 300 sec: 9011.2). Total num frames: 52830208. Throughput: 0: 8965.2. Samples: 52819876. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:07:13,996][744089] Avg episode reward: [(0, '483.913')]
+[2023-03-09 16:07:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000103184_52830208.pth...
+[2023-03-09 16:07:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000102656_52559872.pth
+[2023-03-09 16:07:14,822][744402] Updated weights for policy 0, policy_version 103200 (0.0005)
+[2023-03-09 16:07:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9011.2, 300 sec: 9011.2). Total num frames: 52875264. Throughput: 0: 9031.1. Samples: 52875812. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:07:18,996][744089] Avg episode reward: [(0, '500.528')]
+[2023-03-09 16:07:19,140][744402] Updated weights for policy 0, policy_version 103280 (0.0006)
+[2023-03-09 16:07:23,859][744402] Updated weights for policy 0, policy_version 103360 (0.0005)
+[2023-03-09 16:07:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 8997.3). Total num frames: 52920320. Throughput: 0: 9025.0. Samples: 52903756. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:07:23,996][744089] Avg episode reward: [(0, '503.938')]
+[2023-03-09 16:07:28,271][744402] Updated weights for policy 0, policy_version 103440 (0.0005)
+[2023-03-09 16:07:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9011.2). Total num frames: 52965376. Throughput: 0: 9030.4. Samples: 52957200. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:07:28,995][744089] Avg episode reward: [(0, '513.250')]
+[2023-03-09 16:07:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000103448_52965376.pth...
+[2023-03-09 16:07:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000102912_52690944.pth
+[2023-03-09 16:07:32,815][744402] Updated weights for policy 0, policy_version 103520 (0.0005)
+[2023-03-09 16:07:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9011.2, 300 sec: 9011.2). Total num frames: 53010432. Throughput: 0: 9067.9. Samples: 53011684. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:07:33,995][744089] Avg episode reward: [(0, '489.669')]
+[2023-03-09 16:07:37,075][744402] Updated weights for policy 0, policy_version 103600 (0.0006)
+[2023-03-09 16:07:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9025.1). Total num frames: 53059584. Throughput: 0: 9118.0. Samples: 53039948. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:07:38,996][744089] Avg episode reward: [(0, '485.600')]
+[2023-03-09 16:07:41,359][744402] Updated weights for policy 0, policy_version 103680 (0.0005)
+[2023-03-09 16:07:43,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9079.5, 300 sec: 9039.0). Total num frames: 53104640. Throughput: 0: 9200.9. Samples: 53096864. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:07:43,996][744089] Avg episode reward: [(0, '501.466')]
+[2023-03-09 16:07:44,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000103720_53104640.pth...
+[2023-03-09 16:07:44,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000103184_52830208.pth
+[2023-03-09 16:07:45,856][744402] Updated weights for policy 0, policy_version 103760 (0.0005)
+[2023-03-09 16:07:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9079.5, 300 sec: 9025.1). Total num frames: 53149696. Throughput: 0: 9228.2. Samples: 53151680. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:07:48,995][744089] Avg episode reward: [(0, '488.312')]
+[2023-03-09 16:07:50,333][744402] Updated weights for policy 0, policy_version 103840 (0.0004)
+[2023-03-09 16:07:53,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9216.0, 300 sec: 9039.0). Total num frames: 53198848. Throughput: 0: 9251.6. Samples: 53180724. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:07:53,995][744089] Avg episode reward: [(0, '499.437')]
+[2023-03-09 16:07:54,741][744402] Updated weights for policy 0, policy_version 103920 (0.0005)
+[2023-03-09 16:07:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9039.0). Total num frames: 53243904. Throughput: 0: 9240.8. Samples: 53235712. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:07:58,996][744089] Avg episode reward: [(0, '462.337')]
+[2023-03-09 16:07:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000103992_53243904.pth...
+[2023-03-09 16:07:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000103448_52965376.pth
+[2023-03-09 16:07:59,146][744402] Updated weights for policy 0, policy_version 104000 (0.0005)
+[2023-03-09 16:08:03,636][744402] Updated weights for policy 0, policy_version 104080 (0.0005)
+[2023-03-09 16:08:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9039.0). Total num frames: 53288960. Throughput: 0: 9217.8. Samples: 53290612. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:08:03,996][744089] Avg episode reward: [(0, '486.236')]
+[2023-03-09 16:08:08,054][744402] Updated weights for policy 0, policy_version 104160 (0.0004)
+[2023-03-09 16:08:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9052.9). Total num frames: 53338112. Throughput: 0: 9233.0. Samples: 53319240. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:08:08,995][744089] Avg episode reward: [(0, '422.559')]
+[2023-03-09 16:08:12,527][744402] Updated weights for policy 0, policy_version 104240 (0.0004)
+[2023-03-09 16:08:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9216.0, 300 sec: 9052.9). Total num frames: 53383168. Throughput: 0: 9260.2. Samples: 53373908. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:08:13,996][744089] Avg episode reward: [(0, '486.757')]
+[2023-03-09 16:08:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000104264_53383168.pth...
+[2023-03-09 16:08:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000103720_53104640.pth
+[2023-03-09 16:08:17,004][744402] Updated weights for policy 0, policy_version 104320 (0.0005)
+[2023-03-09 16:08:18,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9052.9). Total num frames: 53428224. Throughput: 0: 9257.9. Samples: 53428288. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:08:18,995][744089] Avg episode reward: [(0, '493.676')]
+[2023-03-09 16:08:21,219][744402] Updated weights for policy 0, policy_version 104400 (0.0005)
+[2023-03-09 16:08:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9066.7). Total num frames: 53477376. Throughput: 0: 9294.4. Samples: 53458196. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:08:23,996][744089] Avg episode reward: [(0, '470.754')]
+[2023-03-09 16:08:25,697][744402] Updated weights for policy 0, policy_version 104480 (0.0005)
+[2023-03-09 16:08:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9284.3, 300 sec: 9066.7). Total num frames: 53522432. Throughput: 0: 9264.5. Samples: 53513768. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:08:28,996][744089] Avg episode reward: [(0, '469.848')]
+[2023-03-09 16:08:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000104536_53522432.pth...
+[2023-03-09 16:08:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000103992_53243904.pth
+[2023-03-09 16:08:30,105][744402] Updated weights for policy 0, policy_version 104560 (0.0005)
+[2023-03-09 16:08:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9066.7). Total num frames: 53567488. Throughput: 0: 9240.2. Samples: 53567488. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:08:33,996][744089] Avg episode reward: [(0, '476.527')]
+[2023-03-09 16:08:34,715][744402] Updated weights for policy 0, policy_version 104640 (0.0005)
+[2023-03-09 16:08:38,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9216.0, 300 sec: 9066.7). Total num frames: 53612544. Throughput: 0: 9221.4. Samples: 53595684. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:08:38,995][744089] Avg episode reward: [(0, '509.369')]
+[2023-03-09 16:08:39,026][744402] Updated weights for policy 0, policy_version 104720 (0.0005)
+[2023-03-09 16:08:43,311][744402] Updated weights for policy 0, policy_version 104800 (0.0005)
+[2023-03-09 16:08:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9284.3, 300 sec: 9066.7). Total num frames: 53661696. Throughput: 0: 9281.5. Samples: 53653380. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:08:43,996][744089] Avg episode reward: [(0, '546.462')]
+[2023-03-09 16:08:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000104808_53661696.pth...
+[2023-03-09 16:08:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000104264_53383168.pth
+[2023-03-09 16:08:44,002][744358] Saving new best policy, reward=546.462!
+[2023-03-09 16:08:47,545][744402] Updated weights for policy 0, policy_version 104880 (0.0006)
+[2023-03-09 16:08:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9352.5, 300 sec: 9080.6). Total num frames: 53710848. Throughput: 0: 9337.3. Samples: 53710788. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:08:48,995][744089] Avg episode reward: [(0, '533.621')]
+[2023-03-09 16:08:52,044][744402] Updated weights for policy 0, policy_version 104960 (0.0004)
+[2023-03-09 16:08:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9284.3, 300 sec: 9066.7). Total num frames: 53755904. Throughput: 0: 9305.1. Samples: 53737968. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:08:53,996][744089] Avg episode reward: [(0, '559.187')]
+[2023-03-09 16:08:53,996][744358] Saving new best policy, reward=559.187!
+[2023-03-09 16:08:56,471][744402] Updated weights for policy 0, policy_version 105040 (0.0005)
+[2023-03-09 16:08:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9066.7). Total num frames: 53800960. Throughput: 0: 9308.0. Samples: 53792768. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:08:58,995][744089] Avg episode reward: [(0, '567.696')]
+[2023-03-09 16:08:59,024][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000105088_53805056.pth...
+[2023-03-09 16:08:59,026][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000104536_53522432.pth
+[2023-03-09 16:08:59,026][744358] Saving new best policy, reward=567.696!
+[2023-03-09 16:09:00,733][744402] Updated weights for policy 0, policy_version 105120 (0.0005)
+[2023-03-09 16:09:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9080.6). Total num frames: 53850112. Throughput: 0: 9407.5. Samples: 53851624. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:09:03,995][744089] Avg episode reward: [(0, '539.310')]
+[2023-03-09 16:09:04,857][744402] Updated weights for policy 0, policy_version 105200 (0.0005)
+[2023-03-09 16:09:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9352.5, 300 sec: 9094.5). Total num frames: 53899264. Throughput: 0: 9400.1. Samples: 53881200. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:09:08,995][744089] Avg episode reward: [(0, '522.511')]
+[2023-03-09 16:09:09,095][744402] Updated weights for policy 0, policy_version 105280 (0.0004)
+[2023-03-09 16:09:13,275][744402] Updated weights for policy 0, policy_version 105360 (0.0005)
+[2023-03-09 16:09:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9122.3). Total num frames: 53948416. Throughput: 0: 9476.8. Samples: 53940224. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:09:13,996][744089] Avg episode reward: [(0, '535.262')]
+[2023-03-09 16:09:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000105368_53948416.pth...
+[2023-03-09 16:09:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000104808_53661696.pth
+[2023-03-09 16:09:17,924][744402] Updated weights for policy 0, policy_version 105440 (0.0005)
+[2023-03-09 16:09:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9122.3). Total num frames: 53993472. Throughput: 0: 9467.7. Samples: 53993536. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:09:18,995][744089] Avg episode reward: [(0, '532.138')]
+[2023-03-09 16:09:22,428][744402] Updated weights for policy 0, policy_version 105520 (0.0005)
+[2023-03-09 16:09:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9136.2). Total num frames: 54038528. Throughput: 0: 9463.4. Samples: 54021540. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:09:23,995][744089] Avg episode reward: [(0, '533.212')]
+[2023-03-09 16:09:26,745][744402] Updated weights for policy 0, policy_version 105600 (0.0005)
+[2023-03-09 16:09:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9136.2). Total num frames: 54087680. Throughput: 0: 9427.0. Samples: 54077596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:09:28,996][744089] Avg episode reward: [(0, '532.660')]
+[2023-03-09 16:09:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000105640_54087680.pth...
+[2023-03-09 16:09:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000105088_53805056.pth
+[2023-03-09 16:09:31,061][744402] Updated weights for policy 0, policy_version 105680 (0.0005)
+[2023-03-09 16:09:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9136.2). Total num frames: 54132736. Throughput: 0: 9408.2. Samples: 54134156. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:09:33,995][744089] Avg episode reward: [(0, '482.461')]
+[2023-03-09 16:09:35,204][744402] Updated weights for policy 0, policy_version 105760 (0.0005)
+[2023-03-09 16:09:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9150.0). Total num frames: 54181888. Throughput: 0: 9468.6. Samples: 54164056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:09:38,995][744089] Avg episode reward: [(0, '474.802')]
+[2023-03-09 16:09:39,603][744402] Updated weights for policy 0, policy_version 105840 (0.0005)
+[2023-03-09 16:09:43,968][744402] Updated weights for policy 0, policy_version 105920 (0.0005)
+[2023-03-09 16:09:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.1, 300 sec: 9150.0). Total num frames: 54231040. Throughput: 0: 9471.8. Samples: 54219000. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:09:43,996][744089] Avg episode reward: [(0, '524.272')]
+[2023-03-09 16:09:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000105920_54231040.pth...
+[2023-03-09 16:09:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000105368_53948416.pth
+[2023-03-09 16:09:48,147][744402] Updated weights for policy 0, policy_version 106000 (0.0005)
+[2023-03-09 16:09:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9150.0). Total num frames: 54276096. Throughput: 0: 9494.0. Samples: 54278852. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:09:48,995][744089] Avg episode reward: [(0, '550.281')]
+[2023-03-09 16:09:52,416][744402] Updated weights for policy 0, policy_version 106080 (0.0006)
+[2023-03-09 16:09:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9177.8). Total num frames: 54325248. Throughput: 0: 9493.3. Samples: 54308400. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:09:53,995][744089] Avg episode reward: [(0, '468.343')]
+[2023-03-09 16:09:56,692][744402] Updated weights for policy 0, policy_version 106160 (0.0005)
+[2023-03-09 16:09:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9191.7). Total num frames: 54374400. Throughput: 0: 9431.5. Samples: 54364640. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:09:58,995][744089] Avg episode reward: [(0, '448.450')]
+[2023-03-09 16:09:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000106200_54374400.pth...
+[2023-03-09 16:09:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000105640_54087680.pth
+[2023-03-09 16:10:01,185][744402] Updated weights for policy 0, policy_version 106240 (0.0005)
+[2023-03-09 16:10:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9191.7). Total num frames: 54419456. Throughput: 0: 9464.9. Samples: 54419456. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:03,995][744089] Avg episode reward: [(0, '556.901')]
+[2023-03-09 16:10:05,551][744402] Updated weights for policy 0, policy_version 106320 (0.0005)
+[2023-03-09 16:10:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9420.8, 300 sec: 9191.7). Total num frames: 54464512. Throughput: 0: 9477.2. Samples: 54448016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:08,996][744089] Avg episode reward: [(0, '562.341')]
+[2023-03-09 16:10:09,918][744402] Updated weights for policy 0, policy_version 106400 (0.0005)
+[2023-03-09 16:10:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9205.6). Total num frames: 54513664. Throughput: 0: 9489.1. Samples: 54504604. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:13,996][744089] Avg episode reward: [(0, '559.757')]
+[2023-03-09 16:10:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000106472_54513664.pth...
+[2023-03-09 16:10:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000105920_54231040.pth
+[2023-03-09 16:10:14,201][744402] Updated weights for policy 0, policy_version 106480 (0.0005)
+[2023-03-09 16:10:18,528][744402] Updated weights for policy 0, policy_version 106560 (0.0005)
+[2023-03-09 16:10:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9205.6). Total num frames: 54558720. Throughput: 0: 9508.6. Samples: 54562044. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:18,995][744089] Avg episode reward: [(0, '500.245')]
+[2023-03-09 16:10:23,009][744402] Updated weights for policy 0, policy_version 106640 (0.0005)
+[2023-03-09 16:10:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9219.5). Total num frames: 54607872. Throughput: 0: 9416.9. Samples: 54587816. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:23,995][744089] Avg episode reward: [(0, '526.271')]
+[2023-03-09 16:10:27,316][744402] Updated weights for policy 0, policy_version 106720 (0.0005)
+[2023-03-09 16:10:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9219.5). Total num frames: 54652928. Throughput: 0: 9461.1. Samples: 54644748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:28,996][744089] Avg episode reward: [(0, '572.473')]
+[2023-03-09 16:10:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000106744_54652928.pth...
+[2023-03-09 16:10:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000106200_54374400.pth
+[2023-03-09 16:10:29,002][744358] Saving new best policy, reward=572.473!
+[2023-03-09 16:10:31,781][744402] Updated weights for policy 0, policy_version 106800 (0.0005)
+[2023-03-09 16:10:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9489.1, 300 sec: 9233.4). Total num frames: 54702080. Throughput: 0: 9404.1. Samples: 54702036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:33,996][744089] Avg episode reward: [(0, '565.962')]
+[2023-03-09 16:10:36,017][744402] Updated weights for policy 0, policy_version 106880 (0.0005)
+[2023-03-09 16:10:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9219.5). Total num frames: 54747136. Throughput: 0: 9381.2. Samples: 54730552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:38,996][744089] Avg episode reward: [(0, '578.897')]
+[2023-03-09 16:10:38,996][744358] Saving new best policy, reward=578.897!
+[2023-03-09 16:10:40,450][744402] Updated weights for policy 0, policy_version 106960 (0.0004)
+[2023-03-09 16:10:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9233.4). Total num frames: 54796288. Throughput: 0: 9349.5. Samples: 54785368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:43,996][744089] Avg episode reward: [(0, '562.709')]
+[2023-03-09 16:10:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000107024_54796288.pth...
+[2023-03-09 16:10:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000106472_54513664.pth
+[2023-03-09 16:10:44,912][744402] Updated weights for policy 0, policy_version 107040 (0.0005)
+[2023-03-09 16:10:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9233.4). Total num frames: 54841344. Throughput: 0: 9407.6. Samples: 54842796. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:48,995][744089] Avg episode reward: [(0, '564.223')]
+[2023-03-09 16:10:49,063][744402] Updated weights for policy 0, policy_version 107120 (0.0005)
+[2023-03-09 16:10:53,439][744402] Updated weights for policy 0, policy_version 107200 (0.0004)
+[2023-03-09 16:10:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9247.2). Total num frames: 54890496. Throughput: 0: 9411.8. Samples: 54871544. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:53,995][744089] Avg episode reward: [(0, '568.099')]
+[2023-03-09 16:10:57,834][744402] Updated weights for policy 0, policy_version 107280 (0.0005)
+[2023-03-09 16:10:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9420.8, 300 sec: 9275.0). Total num frames: 54939648. Throughput: 0: 9394.8. Samples: 54927368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:10:58,996][744089] Avg episode reward: [(0, '566.705')]
+[2023-03-09 16:10:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000107304_54939648.pth...
+[2023-03-09 16:10:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000106744_54652928.pth
+[2023-03-09 16:11:01,961][744402] Updated weights for policy 0, policy_version 107360 (0.0006)
+[2023-03-09 16:11:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9275.0). Total num frames: 54984704. Throughput: 0: 9384.6. Samples: 54984352. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:11:03,996][744089] Avg episode reward: [(0, '562.505')]
+[2023-03-09 16:11:06,547][744402] Updated weights for policy 0, policy_version 107440 (0.0005)
+[2023-03-09 16:11:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9420.8, 300 sec: 9275.0). Total num frames: 55029760. Throughput: 0: 9439.0. Samples: 55012572. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:11:08,995][744089] Avg episode reward: [(0, '556.751')]
+[2023-03-09 16:11:10,860][744402] Updated weights for policy 0, policy_version 107520 (0.0005)
+[2023-03-09 16:11:13,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9352.5, 300 sec: 9288.9). Total num frames: 55074816. Throughput: 0: 9394.9. Samples: 55067520. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:11:13,996][744089] Avg episode reward: [(0, '546.196')]
+[2023-03-09 16:11:14,028][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000107576_55078912.pth...
+[2023-03-09 16:11:14,030][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000107024_54796288.pth
+[2023-03-09 16:11:15,317][744402] Updated weights for policy 0, policy_version 107600 (0.0005)
+[2023-03-09 16:11:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9302.8). Total num frames: 55123968. Throughput: 0: 9376.3. Samples: 55123968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:11:18,996][744089] Avg episode reward: [(0, '541.493')]
+[2023-03-09 16:11:19,669][744402] Updated weights for policy 0, policy_version 107680 (0.0005)
+[2023-03-09 16:11:23,859][744402] Updated weights for policy 0, policy_version 107760 (0.0005)
+[2023-03-09 16:11:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9316.7). Total num frames: 55173120. Throughput: 0: 9390.6. Samples: 55153128. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:11:23,995][744089] Avg episode reward: [(0, '547.840')]
+[2023-03-09 16:11:28,075][744402] Updated weights for policy 0, policy_version 107840 (0.0005)
+[2023-03-09 16:11:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.1, 300 sec: 9330.5). Total num frames: 55222272. Throughput: 0: 9481.4. Samples: 55212032. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:11:28,996][744089] Avg episode reward: [(0, '562.813')]
+[2023-03-09 16:11:29,001][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000107856_55222272.pth...
+[2023-03-09 16:11:29,004][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000107304_54939648.pth
+[2023-03-09 16:11:32,331][744402] Updated weights for policy 0, policy_version 107920 (0.0005)
+[2023-03-09 16:11:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9330.6). Total num frames: 55267328. Throughput: 0: 9474.9. Samples: 55269168. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:11:33,995][744089] Avg episode reward: [(0, '560.265')]
+[2023-03-09 16:11:36,578][744402] Updated weights for policy 0, policy_version 108000 (0.0005)
+[2023-03-09 16:11:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9344.4). Total num frames: 55316480. Throughput: 0: 9489.8. Samples: 55298588. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:11:38,996][744089] Avg episode reward: [(0, '567.852')]
+[2023-03-09 16:11:41,072][744402] Updated weights for policy 0, policy_version 108080 (0.0005)
+[2023-03-09 16:11:43,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9420.8, 300 sec: 9344.4). Total num frames: 55361536. Throughput: 0: 9466.1. Samples: 55353344. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:11:43,996][744089] Avg episode reward: [(0, '565.643')]
+[2023-03-09 16:11:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000108128_55361536.pth...
+[2023-03-09 16:11:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000107576_55078912.pth
+[2023-03-09 16:11:45,438][744402] Updated weights for policy 0, policy_version 108160 (0.0005)
+[2023-03-09 16:11:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9372.2). Total num frames: 55410688. Throughput: 0: 9474.2. Samples: 55410688. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:11:48,995][744089] Avg episode reward: [(0, '583.345')]
+[2023-03-09 16:11:48,996][744358] Saving new best policy, reward=583.345!
+[2023-03-09 16:11:49,662][744402] Updated weights for policy 0, policy_version 108240 (0.0005)
+[2023-03-09 16:11:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9372.2). Total num frames: 55455744. Throughput: 0: 9484.2. Samples: 55439360. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:11:53,995][744089] Avg episode reward: [(0, '581.947')]
+[2023-03-09 16:11:54,065][744402] Updated weights for policy 0, policy_version 108320 (0.0005)
+[2023-03-09 16:11:58,417][744402] Updated weights for policy 0, policy_version 108400 (0.0005)
+[2023-03-09 16:11:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9386.1). Total num frames: 55504896. Throughput: 0: 9500.1. Samples: 55495024. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:11:58,995][744089] Avg episode reward: [(0, '557.178')]
+[2023-03-09 16:11:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000108408_55504896.pth...
+[2023-03-09 16:11:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000107856_55222272.pth
+[2023-03-09 16:12:02,538][744402] Updated weights for policy 0, policy_version 108480 (0.0005)
+[2023-03-09 16:12:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9400.0). Total num frames: 55554048. Throughput: 0: 9557.6. Samples: 55554060. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:12:03,995][744089] Avg episode reward: [(0, '565.724')]
+[2023-03-09 16:12:06,753][744402] Updated weights for policy 0, policy_version 108560 (0.0005)
+[2023-03-09 16:12:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9400.0). Total num frames: 55603200. Throughput: 0: 9551.7. Samples: 55582956. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:12:08,995][744089] Avg episode reward: [(0, '520.251')]
+[2023-03-09 16:12:11,181][744402] Updated weights for policy 0, policy_version 108640 (0.0005)
+[2023-03-09 16:12:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9400.0). Total num frames: 55648256. Throughput: 0: 9498.4. Samples: 55639460. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:12:13,996][744089] Avg episode reward: [(0, '559.313')]
+[2023-03-09 16:12:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000108688_55648256.pth...
+[2023-03-09 16:12:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000108128_55361536.pth
+[2023-03-09 16:12:15,653][744402] Updated weights for policy 0, policy_version 108720 (0.0005)
+[2023-03-09 16:12:18,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9489.1, 300 sec: 9400.0). Total num frames: 55693312. Throughput: 0: 9461.0. Samples: 55694912. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:12:18,995][744089] Avg episode reward: [(0, '560.187')]
+[2023-03-09 16:12:20,119][744402] Updated weights for policy 0, policy_version 108800 (0.0005)
+[2023-03-09 16:12:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9420.8, 300 sec: 9400.0). Total num frames: 55738368. Throughput: 0: 9409.0. Samples: 55721992. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:12:23,995][744089] Avg episode reward: [(0, '530.491')]
+[2023-03-09 16:12:24,443][744402] Updated weights for policy 0, policy_version 108880 (0.0005)
+[2023-03-09 16:12:28,741][744402] Updated weights for policy 0, policy_version 108960 (0.0005)
+[2023-03-09 16:12:28,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9420.8, 300 sec: 9413.9). Total num frames: 55787520. Throughput: 0: 9464.6. Samples: 55779252. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:12:28,996][744089] Avg episode reward: [(0, '532.100')]
+[2023-03-09 16:12:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000108960_55787520.pth...
+[2023-03-09 16:12:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000108408_55504896.pth
+[2023-03-09 16:12:32,925][744402] Updated weights for policy 0, policy_version 109040 (0.0006)
+[2023-03-09 16:12:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9413.9). Total num frames: 55836672. Throughput: 0: 9467.9. Samples: 55836744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:12:33,995][744089] Avg episode reward: [(0, '525.671')]
+[2023-03-09 16:12:37,244][744402] Updated weights for policy 0, policy_version 109120 (0.0005)
+[2023-03-09 16:12:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9427.7). Total num frames: 55885824. Throughput: 0: 9466.6. Samples: 55865356. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:12:38,996][744089] Avg episode reward: [(0, '541.542')]
+[2023-03-09 16:12:41,475][744402] Updated weights for policy 0, policy_version 109200 (0.0005)
+[2023-03-09 16:12:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9427.7). Total num frames: 55930880. Throughput: 0: 9503.9. Samples: 55922700. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:12:43,995][744089] Avg episode reward: [(0, '542.525')]
+[2023-03-09 16:12:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000109240_55930880.pth...
+[2023-03-09 16:12:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000108688_55648256.pth
+[2023-03-09 16:12:45,747][744402] Updated weights for policy 0, policy_version 109280 (0.0005)
+[2023-03-09 16:12:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9427.7). Total num frames: 55980032. Throughput: 0: 9460.5. Samples: 55979784. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:12:48,995][744089] Avg episode reward: [(0, '538.005')]
+[2023-03-09 16:12:50,305][744402] Updated weights for policy 0, policy_version 109360 (0.0006)
+[2023-03-09 16:12:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9427.7). Total num frames: 56025088. Throughput: 0: 9397.5. Samples: 56005844. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:12:53,995][744089] Avg episode reward: [(0, '566.251')]
+[2023-03-09 16:12:54,609][744402] Updated weights for policy 0, policy_version 109440 (0.0005)
+[2023-03-09 16:12:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9420.8, 300 sec: 9427.7). Total num frames: 56070144. Throughput: 0: 9400.5. Samples: 56062480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:12:58,995][744089] Avg episode reward: [(0, '564.242')]
+[2023-03-09 16:12:59,055][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000109520_56074240.pth...
+[2023-03-09 16:12:59,056][744402] Updated weights for policy 0, policy_version 109520 (0.0006)
+[2023-03-09 16:12:59,058][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000108960_55787520.pth
+[2023-03-09 16:13:03,327][744402] Updated weights for policy 0, policy_version 109600 (0.0005)
+[2023-03-09 16:13:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9427.7). Total num frames: 56119296. Throughput: 0: 9452.2. Samples: 56120260. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:03,995][744089] Avg episode reward: [(0, '559.692')]
+[2023-03-09 16:13:07,608][744402] Updated weights for policy 0, policy_version 109680 (0.0005)
+[2023-03-09 16:13:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9441.6). Total num frames: 56168448. Throughput: 0: 9493.9. Samples: 56149216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:08,995][744089] Avg episode reward: [(0, '542.525')]
+[2023-03-09 16:13:11,878][744402] Updated weights for policy 0, policy_version 109760 (0.0005)
+[2023-03-09 16:13:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.1, 300 sec: 9455.5). Total num frames: 56217600. Throughput: 0: 9506.4. Samples: 56207040. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:13,996][744089] Avg episode reward: [(0, '522.945')]
+[2023-03-09 16:13:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000109800_56217600.pth...
+[2023-03-09 16:13:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000109240_55930880.pth
+[2023-03-09 16:13:16,115][744402] Updated weights for policy 0, policy_version 109840 (0.0006)
+[2023-03-09 16:13:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.0, 300 sec: 9441.6). Total num frames: 56262656. Throughput: 0: 9480.1. Samples: 56263348. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:18,995][744089] Avg episode reward: [(0, '527.996')]
+[2023-03-09 16:13:20,384][744402] Updated weights for policy 0, policy_version 109920 (0.0005)
+[2023-03-09 16:13:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9455.5). Total num frames: 56311808. Throughput: 0: 9493.9. Samples: 56292580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:23,995][744089] Avg episode reward: [(0, '543.134')]
+[2023-03-09 16:13:24,734][744402] Updated weights for policy 0, policy_version 110000 (0.0005)
+[2023-03-09 16:13:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9489.1, 300 sec: 9455.5). Total num frames: 56356864. Throughput: 0: 9466.2. Samples: 56348680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:28,995][744089] Avg episode reward: [(0, '545.107')]
+[2023-03-09 16:13:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000110072_56356864.pth...
+[2023-03-09 16:13:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000109520_56074240.pth
+[2023-03-09 16:13:29,079][744402] Updated weights for policy 0, policy_version 110080 (0.0005)
+[2023-03-09 16:13:33,334][744402] Updated weights for policy 0, policy_version 110160 (0.0005)
+[2023-03-09 16:13:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9469.4). Total num frames: 56406016. Throughput: 0: 9473.4. Samples: 56406088. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:33,995][744089] Avg episode reward: [(0, '554.025')]
+[2023-03-09 16:13:37,824][744402] Updated weights for policy 0, policy_version 110240 (0.0005)
+[2023-03-09 16:13:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9455.5). Total num frames: 56451072. Throughput: 0: 9512.5. Samples: 56433908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:38,995][744089] Avg episode reward: [(0, '537.404')]
+[2023-03-09 16:13:42,171][744402] Updated weights for policy 0, policy_version 110320 (0.0005)
+[2023-03-09 16:13:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9489.1, 300 sec: 9455.5). Total num frames: 56500224. Throughput: 0: 9500.0. Samples: 56489980. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:43,996][744089] Avg episode reward: [(0, '523.296')]
+[2023-03-09 16:13:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000110352_56500224.pth...
+[2023-03-09 16:13:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000109800_56217600.pth
+[2023-03-09 16:13:46,401][744402] Updated weights for policy 0, policy_version 110400 (0.0005)
+[2023-03-09 16:13:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9469.4). Total num frames: 56549376. Throughput: 0: 9513.5. Samples: 56548368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:48,996][744089] Avg episode reward: [(0, '564.467')]
+[2023-03-09 16:13:50,636][744402] Updated weights for policy 0, policy_version 110480 (0.0005)
+[2023-03-09 16:13:53,995][744089] Fps is (10 sec: 9830.6, 60 sec: 9557.3, 300 sec: 9483.3). Total num frames: 56598528. Throughput: 0: 9499.6. Samples: 56576696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:53,995][744089] Avg episode reward: [(0, '554.731')]
+[2023-03-09 16:13:54,823][744402] Updated weights for policy 0, policy_version 110560 (0.0006)
+[2023-03-09 16:13:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9469.4). Total num frames: 56643584. Throughput: 0: 9523.2. Samples: 56635584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:13:58,995][744089] Avg episode reward: [(0, '419.154')]
+[2023-03-09 16:13:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000110632_56643584.pth...
+[2023-03-09 16:13:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000110072_56356864.pth
+[2023-03-09 16:13:59,112][744402] Updated weights for policy 0, policy_version 110640 (0.0005)
+[2023-03-09 16:14:03,325][744402] Updated weights for policy 0, policy_version 110720 (0.0005)
+[2023-03-09 16:14:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9469.4). Total num frames: 56692736. Throughput: 0: 9543.6. Samples: 56692808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:14:03,995][744089] Avg episode reward: [(0, '467.071')]
+[2023-03-09 16:14:07,504][744402] Updated weights for policy 0, policy_version 110800 (0.0005)
+[2023-03-09 16:14:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9469.4). Total num frames: 56741888. Throughput: 0: 9565.0. Samples: 56723004. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:14:08,995][744089] Avg episode reward: [(0, '374.425')]
+[2023-03-09 16:14:11,683][744402] Updated weights for policy 0, policy_version 110880 (0.0005)
+[2023-03-09 16:14:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9483.3). Total num frames: 56791040. Throughput: 0: 9616.0. Samples: 56781400. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:14:13,996][744089] Avg episode reward: [(0, '428.395')]
+[2023-03-09 16:14:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000110920_56791040.pth...
+[2023-03-09 16:14:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000110352_56500224.pth
+[2023-03-09 16:14:15,970][744402] Updated weights for policy 0, policy_version 110960 (0.0005)
+[2023-03-09 16:14:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9497.2). Total num frames: 56840192. Throughput: 0: 9629.4. Samples: 56839412. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:14:18,995][744089] Avg episode reward: [(0, '565.528')]
+[2023-03-09 16:14:20,147][744402] Updated weights for policy 0, policy_version 111040 (0.0005)
+[2023-03-09 16:14:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9497.2). Total num frames: 56889344. Throughput: 0: 9665.2. Samples: 56868840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:14:23,995][744089] Avg episode reward: [(0, '482.833')]
+[2023-03-09 16:14:24,399][744402] Updated weights for policy 0, policy_version 111120 (0.0005)
+[2023-03-09 16:14:28,533][744402] Updated weights for policy 0, policy_version 111200 (0.0005)
+[2023-03-09 16:14:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9511.0). Total num frames: 56938496. Throughput: 0: 9714.8. Samples: 56927148. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:14:28,996][744089] Avg episode reward: [(0, '283.165')]
+[2023-03-09 16:14:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000111208_56938496.pth...
+[2023-03-09 16:14:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000110632_56643584.pth
+[2023-03-09 16:14:32,529][744402] Updated weights for policy 0, policy_version 111280 (0.0005)
+[2023-03-09 16:14:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9511.0). Total num frames: 56987648. Throughput: 0: 9774.7. Samples: 56988228. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:14:33,995][744089] Avg episode reward: [(0, '441.513')]
+[2023-03-09 16:14:36,720][744402] Updated weights for policy 0, policy_version 111360 (0.0005)
+[2023-03-09 16:14:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9511.1). Total num frames: 57036800. Throughput: 0: 9781.2. Samples: 57016852. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:14:38,996][744089] Avg episode reward: [(0, '539.678')]
+[2023-03-09 16:14:41,057][744402] Updated weights for policy 0, policy_version 111440 (0.0005)
+[2023-03-09 16:14:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9511.0). Total num frames: 57081856. Throughput: 0: 9736.7. Samples: 57073736. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:14:43,995][744089] Avg episode reward: [(0, '566.862')]
+[2023-03-09 16:14:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000111488_57081856.pth...
+[2023-03-09 16:14:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000110920_56791040.pth
+[2023-03-09 16:14:45,323][744402] Updated weights for policy 0, policy_version 111520 (0.0005)
+[2023-03-09 16:14:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9511.0). Total num frames: 57131008. Throughput: 0: 9739.5. Samples: 57131088. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:14:48,996][744089] Avg episode reward: [(0, '559.826')]
+[2023-03-09 16:14:49,665][744402] Updated weights for policy 0, policy_version 111600 (0.0005)
+[2023-03-09 16:14:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9497.2). Total num frames: 57176064. Throughput: 0: 9691.5. Samples: 57159120. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:14:53,995][744089] Avg episode reward: [(0, '573.444')]
+[2023-03-09 16:14:54,100][744402] Updated weights for policy 0, policy_version 111680 (0.0005)
+[2023-03-09 16:14:58,537][744402] Updated weights for policy 0, policy_version 111760 (0.0005)
+[2023-03-09 16:14:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9511.1). Total num frames: 57225216. Throughput: 0: 9623.4. Samples: 57214452. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:14:58,995][744089] Avg episode reward: [(0, '570.855')]
+[2023-03-09 16:14:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000111768_57225216.pth...
+[2023-03-09 16:14:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000111208_56938496.pth
+[2023-03-09 16:15:02,842][744402] Updated weights for policy 0, policy_version 111840 (0.0005)
+[2023-03-09 16:15:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9511.1). Total num frames: 57270272. Throughput: 0: 9587.4. Samples: 57270844. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:03,996][744089] Avg episode reward: [(0, '563.494')]
+[2023-03-09 16:15:07,290][744402] Updated weights for policy 0, policy_version 111920 (0.0005)
+[2023-03-09 16:15:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9557.3, 300 sec: 9497.2). Total num frames: 57315328. Throughput: 0: 9556.6. Samples: 57298888. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:08,995][744089] Avg episode reward: [(0, '583.186')]
+[2023-03-09 16:15:11,504][744402] Updated weights for policy 0, policy_version 112000 (0.0006)
+[2023-03-09 16:15:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9511.0). Total num frames: 57364480. Throughput: 0: 9534.5. Samples: 57356200. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:13,996][744089] Avg episode reward: [(0, '573.463')]
+[2023-03-09 16:15:14,023][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000112048_57368576.pth...
+[2023-03-09 16:15:14,026][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000111488_57081856.pth
+[2023-03-09 16:15:15,742][744402] Updated weights for policy 0, policy_version 112080 (0.0005)
+[2023-03-09 16:15:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9511.0). Total num frames: 57413632. Throughput: 0: 9504.5. Samples: 57415932. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:18,995][744089] Avg episode reward: [(0, '561.204')]
+[2023-03-09 16:15:20,069][744402] Updated weights for policy 0, policy_version 112160 (0.0005)
+[2023-03-09 16:15:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9511.1). Total num frames: 57458688. Throughput: 0: 9454.5. Samples: 57442304. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:23,995][744089] Avg episode reward: [(0, '582.621')]
+[2023-03-09 16:15:24,517][744402] Updated weights for policy 0, policy_version 112240 (0.0005)
+[2023-03-09 16:15:28,607][744402] Updated weights for policy 0, policy_version 112320 (0.0005)
+[2023-03-09 16:15:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9511.1). Total num frames: 57507840. Throughput: 0: 9462.9. Samples: 57499568. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:28,995][744089] Avg episode reward: [(0, '562.319')]
+[2023-03-09 16:15:29,034][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000112328_57511936.pth...
+[2023-03-09 16:15:29,036][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000111768_57225216.pth
+[2023-03-09 16:15:32,824][744402] Updated weights for policy 0, policy_version 112400 (0.0005)
+[2023-03-09 16:15:33,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9557.3, 300 sec: 9538.8). Total num frames: 57561088. Throughput: 0: 9526.9. Samples: 57559800. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:33,996][744089] Avg episode reward: [(0, '554.653')]
+[2023-03-09 16:15:36,975][744402] Updated weights for policy 0, policy_version 112480 (0.0005)
+[2023-03-09 16:15:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9524.9). Total num frames: 57606144. Throughput: 0: 9555.8. Samples: 57589132. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:38,995][744089] Avg episode reward: [(0, '580.703')]
+[2023-03-09 16:15:41,347][744402] Updated weights for policy 0, policy_version 112560 (0.0005)
+[2023-03-09 16:15:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9538.8). Total num frames: 57655296. Throughput: 0: 9556.1. Samples: 57644476. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:43,996][744089] Avg episode reward: [(0, '584.563')]
+[2023-03-09 16:15:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000112608_57655296.pth...
+[2023-03-09 16:15:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000112048_57368576.pth
+[2023-03-09 16:15:44,002][744358] Saving new best policy, reward=584.563!
+[2023-03-09 16:15:45,627][744402] Updated weights for policy 0, policy_version 112640 (0.0005)
+[2023-03-09 16:15:48,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9557.4, 300 sec: 9538.8). Total num frames: 57704448. Throughput: 0: 9611.1. Samples: 57703344. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:48,995][744089] Avg episode reward: [(0, '581.627')]
+[2023-03-09 16:15:49,884][744402] Updated weights for policy 0, policy_version 112720 (0.0005)
+[2023-03-09 16:15:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9524.9). Total num frames: 57749504. Throughput: 0: 9625.8. Samples: 57732048. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:53,995][744089] Avg episode reward: [(0, '572.339')]
+[2023-03-09 16:15:54,147][744402] Updated weights for policy 0, policy_version 112800 (0.0005)
+[2023-03-09 16:15:58,382][744402] Updated weights for policy 0, policy_version 112880 (0.0005)
+[2023-03-09 16:15:58,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9557.3, 300 sec: 9538.8). Total num frames: 57798656. Throughput: 0: 9647.6. Samples: 57790340. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:15:58,996][744089] Avg episode reward: [(0, '578.903')]
+[2023-03-09 16:15:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000112888_57798656.pth...
+[2023-03-09 16:15:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000112328_57511936.pth
+[2023-03-09 16:16:02,566][744402] Updated weights for policy 0, policy_version 112960 (0.0006)
+[2023-03-09 16:16:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 57847808. Throughput: 0: 9597.2. Samples: 57847808. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:16:03,995][744089] Avg episode reward: [(0, '552.015')]
+[2023-03-09 16:16:06,903][744402] Updated weights for policy 0, policy_version 113040 (0.0005)
+[2023-03-09 16:16:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9566.6). Total num frames: 57896960. Throughput: 0: 9644.4. Samples: 57876304. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:16:08,996][744089] Avg episode reward: [(0, '547.581')]
+[2023-03-09 16:16:10,990][744402] Updated weights for policy 0, policy_version 113120 (0.0004)
+[2023-03-09 16:16:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9566.6). Total num frames: 57946112. Throughput: 0: 9680.6. Samples: 57935196. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:16:13,995][744089] Avg episode reward: [(0, '552.451')]
+[2023-03-09 16:16:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000113176_57946112.pth...
+[2023-03-09 16:16:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000112608_57655296.pth
+[2023-03-09 16:16:15,127][744402] Updated weights for policy 0, policy_version 113200 (0.0005)
+[2023-03-09 16:16:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9566.6). Total num frames: 57995264. Throughput: 0: 9676.9. Samples: 57995260. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:16:18,996][744089] Avg episode reward: [(0, '560.945')]
+[2023-03-09 16:16:19,332][744402] Updated weights for policy 0, policy_version 113280 (0.0006)
+[2023-03-09 16:16:23,408][744402] Updated weights for policy 0, policy_version 113360 (0.0005)
+[2023-03-09 16:16:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9566.6). Total num frames: 58044416. Throughput: 0: 9662.8. Samples: 58023960. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:16:23,995][744089] Avg episode reward: [(0, '545.709')]
+[2023-03-09 16:16:27,687][744402] Updated weights for policy 0, policy_version 113440 (0.0005)
+[2023-03-09 16:16:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9566.6). Total num frames: 58089472. Throughput: 0: 9733.2. Samples: 58082472. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:16:28,995][744089] Avg episode reward: [(0, '566.069')]
+[2023-03-09 16:16:29,031][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000113464_58093568.pth...
+[2023-03-09 16:16:29,033][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000112888_57798656.pth
+[2023-03-09 16:16:31,907][744402] Updated weights for policy 0, policy_version 113520 (0.0005)
+[2023-03-09 16:16:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9566.6). Total num frames: 58138624. Throughput: 0: 9686.4. Samples: 58139232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:16:33,995][744089] Avg episode reward: [(0, '520.958')]
+[2023-03-09 16:16:36,258][744402] Updated weights for policy 0, policy_version 113600 (0.0005)
+[2023-03-09 16:16:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9580.5). Total num frames: 58187776. Throughput: 0: 9680.2. Samples: 58167656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:16:38,996][744089] Avg episode reward: [(0, '533.201')]
+[2023-03-09 16:16:40,555][744402] Updated weights for policy 0, policy_version 113680 (0.0005)
+[2023-03-09 16:16:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9566.6). Total num frames: 58232832. Throughput: 0: 9698.0. Samples: 58226748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:16:43,995][744089] Avg episode reward: [(0, '533.957')]
+[2023-03-09 16:16:44,036][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000113744_58236928.pth...
+[2023-03-09 16:16:44,038][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000113176_57946112.pth
+[2023-03-09 16:16:44,891][744402] Updated weights for policy 0, policy_version 113760 (0.0005)
+[2023-03-09 16:16:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9580.5). Total num frames: 58281984. Throughput: 0: 9650.0. Samples: 58282056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:16:48,995][744089] Avg episode reward: [(0, '553.507')]
+[2023-03-09 16:16:49,252][744402] Updated weights for policy 0, policy_version 113840 (0.0005)
+[2023-03-09 16:16:53,329][744402] Updated weights for policy 0, policy_version 113920 (0.0005)
+[2023-03-09 16:16:53,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9580.5). Total num frames: 58331136. Throughput: 0: 9653.9. Samples: 58310728. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:16:53,996][744089] Avg episode reward: [(0, '569.920')]
+[2023-03-09 16:16:57,011][744402] Updated weights for policy 0, policy_version 114000 (0.0006)
+[2023-03-09 16:16:58,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9762.2, 300 sec: 9594.4). Total num frames: 58384384. Throughput: 0: 9800.1. Samples: 58376200. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:16:58,995][744089] Avg episode reward: [(0, '563.099')]
+[2023-03-09 16:16:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000114032_58384384.pth...
+[2023-03-09 16:16:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000113464_58093568.pth
+[2023-03-09 16:17:01,093][744402] Updated weights for policy 0, policy_version 114080 (0.0005)
+[2023-03-09 16:17:03,995][744089] Fps is (10 sec: 10649.6, 60 sec: 9830.4, 300 sec: 9608.2). Total num frames: 58437632. Throughput: 0: 9831.9. Samples: 58437696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:03,995][744089] Avg episode reward: [(0, '561.122')]
+[2023-03-09 16:17:04,914][744402] Updated weights for policy 0, policy_version 114160 (0.0005)
+[2023-03-09 16:17:08,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9622.1). Total num frames: 58486784. Throughput: 0: 9921.2. Samples: 58470412. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:08,995][744089] Avg episode reward: [(0, '572.706')]
+[2023-03-09 16:17:09,024][744402] Updated weights for policy 0, policy_version 114240 (0.0005)
+[2023-03-09 16:17:13,052][744402] Updated weights for policy 0, policy_version 114320 (0.0005)
+[2023-03-09 16:17:13,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9898.7, 300 sec: 9649.9). Total num frames: 58540032. Throughput: 0: 9906.9. Samples: 58528284. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:13,996][744089] Avg episode reward: [(0, '531.446')]
+[2023-03-09 16:17:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000114336_58540032.pth...
+[2023-03-09 16:17:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000113744_58236928.pth
+[2023-03-09 16:17:17,260][744402] Updated weights for policy 0, policy_version 114400 (0.0006)
+[2023-03-09 16:17:18,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9663.8). Total num frames: 58589184. Throughput: 0: 9992.0. Samples: 58588872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:18,995][744089] Avg episode reward: [(0, '553.597')]
+[2023-03-09 16:17:21,507][744402] Updated weights for policy 0, policy_version 114480 (0.0005)
+[2023-03-09 16:17:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9649.9). Total num frames: 58634240. Throughput: 0: 9993.9. Samples: 58617380. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:23,995][744089] Avg episode reward: [(0, '572.859')]
+[2023-03-09 16:17:25,801][744402] Updated weights for policy 0, policy_version 114560 (0.0005)
+[2023-03-09 16:17:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9898.7, 300 sec: 9649.9). Total num frames: 58683392. Throughput: 0: 9962.3. Samples: 58675052. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:28,995][744089] Avg episode reward: [(0, '524.562')]
+[2023-03-09 16:17:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000114616_58683392.pth...
+[2023-03-09 16:17:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000114032_58384384.pth
+[2023-03-09 16:17:30,011][744402] Updated weights for policy 0, policy_version 114640 (0.0005)
+[2023-03-09 16:17:33,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9898.7, 300 sec: 9649.9). Total num frames: 58732544. Throughput: 0: 10027.9. Samples: 58733312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:33,995][744089] Avg episode reward: [(0, '576.428')]
+[2023-03-09 16:17:34,211][744402] Updated weights for policy 0, policy_version 114720 (0.0006)
+[2023-03-09 16:17:38,460][744402] Updated weights for policy 0, policy_version 114800 (0.0005)
+[2023-03-09 16:17:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9663.8). Total num frames: 58781696. Throughput: 0: 10012.5. Samples: 58761288. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:38,995][744089] Avg episode reward: [(0, '590.751')]
+[2023-03-09 16:17:38,996][744358] Saving new best policy, reward=590.751!
+[2023-03-09 16:17:42,608][744402] Updated weights for policy 0, policy_version 114880 (0.0005)
+[2023-03-09 16:17:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9966.9, 300 sec: 9663.8). Total num frames: 58830848. Throughput: 0: 9877.8. Samples: 58820704. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:43,996][744089] Avg episode reward: [(0, '580.412')]
+[2023-03-09 16:17:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000114904_58830848.pth...
+[2023-03-09 16:17:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000114336_58540032.pth
+[2023-03-09 16:17:46,801][744402] Updated weights for policy 0, policy_version 114960 (0.0005)
+[2023-03-09 16:17:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9677.7). Total num frames: 58880000. Throughput: 0: 9828.7. Samples: 58879988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:48,995][744089] Avg episode reward: [(0, '558.157')]
+[2023-03-09 16:17:50,864][744402] Updated weights for policy 0, policy_version 115040 (0.0005)
+[2023-03-09 16:17:53,995][744089] Fps is (10 sec: 10240.0, 60 sec: 10035.2, 300 sec: 9705.4). Total num frames: 58933248. Throughput: 0: 9768.5. Samples: 58909996. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:53,996][744089] Avg episode reward: [(0, '545.039')]
+[2023-03-09 16:17:54,877][744402] Updated weights for policy 0, policy_version 115120 (0.0006)
+[2023-03-09 16:17:58,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9898.7, 300 sec: 9691.6). Total num frames: 58978304. Throughput: 0: 9816.3. Samples: 58970016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:17:58,995][744089] Avg episode reward: [(0, '330.285')]
+[2023-03-09 16:17:58,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000115192_58978304.pth...
+[2023-03-09 16:17:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000114616_58683392.pth
+[2023-03-09 16:17:59,127][744402] Updated weights for policy 0, policy_version 115200 (0.0006)
+[2023-03-09 16:18:03,423][744402] Updated weights for policy 0, policy_version 115280 (0.0005)
+[2023-03-09 16:18:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 59027456. Throughput: 0: 9746.3. Samples: 59027456. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:03,995][744089] Avg episode reward: [(0, '158.020')]
+[2023-03-09 16:18:07,500][744402] Updated weights for policy 0, policy_version 115360 (0.0005)
+[2023-03-09 16:18:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 59076608. Throughput: 0: 9781.3. Samples: 59057536. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:08,995][744089] Avg episode reward: [(0, '286.673')]
+[2023-03-09 16:18:11,597][744402] Updated weights for policy 0, policy_version 115440 (0.0005)
+[2023-03-09 16:18:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 59125760. Throughput: 0: 9832.3. Samples: 59117508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:13,996][744089] Avg episode reward: [(0, '453.204')]
+[2023-03-09 16:18:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000115480_59125760.pth...
+[2023-03-09 16:18:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000114904_58830848.pth
+[2023-03-09 16:18:15,879][744402] Updated weights for policy 0, policy_version 115520 (0.0005)
+[2023-03-09 16:18:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 59174912. Throughput: 0: 9813.3. Samples: 59174912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:18,995][744089] Avg episode reward: [(0, '408.274')]
+[2023-03-09 16:18:20,036][744402] Updated weights for policy 0, policy_version 115600 (0.0005)
+[2023-03-09 16:18:23,937][744402] Updated weights for policy 0, policy_version 115680 (0.0004)
+[2023-03-09 16:18:23,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9733.2). Total num frames: 59228160. Throughput: 0: 9911.1. Samples: 59207288. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:23,995][744089] Avg episode reward: [(0, '470.349')]
+[2023-03-09 16:18:28,143][744402] Updated weights for policy 0, policy_version 115760 (0.0005)
+[2023-03-09 16:18:28,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9898.7, 300 sec: 9733.2). Total num frames: 59277312. Throughput: 0: 9902.4. Samples: 59266312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:28,996][744089] Avg episode reward: [(0, '555.794')]
+[2023-03-09 16:18:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000115776_59277312.pth...
+[2023-03-09 16:18:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000115192_58978304.pth
+[2023-03-09 16:18:32,323][744402] Updated weights for policy 0, policy_version 115840 (0.0004)
+[2023-03-09 16:18:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9747.1). Total num frames: 59326464. Throughput: 0: 9899.9. Samples: 59325484. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:33,995][744089] Avg episode reward: [(0, '562.176')]
+[2023-03-09 16:18:36,673][744402] Updated weights for policy 0, policy_version 115920 (0.0005)
+[2023-03-09 16:18:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 59371520. Throughput: 0: 9823.7. Samples: 59352064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:38,995][744089] Avg episode reward: [(0, '564.115')]
+[2023-03-09 16:18:40,970][744402] Updated weights for policy 0, policy_version 116000 (0.0005)
+[2023-03-09 16:18:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 59420672. Throughput: 0: 9801.7. Samples: 59411092. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:43,996][744089] Avg episode reward: [(0, '530.878')]
+[2023-03-09 16:18:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000116056_59420672.pth...
+[2023-03-09 16:18:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000115480_59125760.pth
+[2023-03-09 16:18:44,954][744402] Updated weights for policy 0, policy_version 116080 (0.0005)
+[2023-03-09 16:18:48,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 59469824. Throughput: 0: 9837.3. Samples: 59470132. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:48,995][744089] Avg episode reward: [(0, '556.531')]
+[2023-03-09 16:18:49,154][744402] Updated weights for policy 0, policy_version 116160 (0.0005)
+[2023-03-09 16:18:53,261][744402] Updated weights for policy 0, policy_version 116240 (0.0004)
+[2023-03-09 16:18:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 59518976. Throughput: 0: 9888.8. Samples: 59502532. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:53,995][744089] Avg episode reward: [(0, '537.376')]
+[2023-03-09 16:18:57,390][744402] Updated weights for policy 0, policy_version 116320 (0.0005)
+[2023-03-09 16:18:58,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9898.6, 300 sec: 9761.0). Total num frames: 59572224. Throughput: 0: 9847.4. Samples: 59560640. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:18:58,996][744089] Avg episode reward: [(0, '584.784')]
+[2023-03-09 16:18:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000116352_59572224.pth...
+[2023-03-09 16:18:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000115776_59277312.pth
+[2023-03-09 16:19:01,530][744402] Updated weights for policy 0, policy_version 116400 (0.0005)
+[2023-03-09 16:19:03,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9761.0). Total num frames: 59621376. Throughput: 0: 9922.8. Samples: 59621440. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:03,995][744089] Avg episode reward: [(0, '595.527')]
+[2023-03-09 16:19:03,996][744358] Saving new best policy, reward=595.527!
+[2023-03-09 16:19:05,430][744402] Updated weights for policy 0, policy_version 116480 (0.0005)
+[2023-03-09 16:19:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9898.7, 300 sec: 9761.0). Total num frames: 59670528. Throughput: 0: 9867.0. Samples: 59651304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:08,995][744089] Avg episode reward: [(0, '528.327')]
+[2023-03-09 16:19:09,703][744402] Updated weights for policy 0, policy_version 116560 (0.0004)
+[2023-03-09 16:19:13,899][744402] Updated weights for policy 0, policy_version 116640 (0.0005)
+[2023-03-09 16:19:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9761.0). Total num frames: 59719680. Throughput: 0: 9849.2. Samples: 59709528. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:13,996][744089] Avg episode reward: [(0, '582.182')]
+[2023-03-09 16:19:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000116640_59719680.pth...
+[2023-03-09 16:19:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000116056_59420672.pth
+[2023-03-09 16:19:18,236][744402] Updated weights for policy 0, policy_version 116720 (0.0005)
+[2023-03-09 16:19:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 59764736. Throughput: 0: 9782.5. Samples: 59765696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:18,995][744089] Avg episode reward: [(0, '590.758')]
+[2023-03-09 16:19:22,210][744402] Updated weights for policy 0, policy_version 116800 (0.0005)
+[2023-03-09 16:19:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 59817984. Throughput: 0: 9900.1. Samples: 59797568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:23,995][744089] Avg episode reward: [(0, '589.172')]
+[2023-03-09 16:19:26,178][744402] Updated weights for policy 0, policy_version 116880 (0.0005)
+[2023-03-09 16:19:28,995][744089] Fps is (10 sec: 10649.4, 60 sec: 9898.7, 300 sec: 9774.9). Total num frames: 59871232. Throughput: 0: 9977.8. Samples: 59860092. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:28,996][744089] Avg episode reward: [(0, '596.829')]
+[2023-03-09 16:19:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000116936_59871232.pth...
+[2023-03-09 16:19:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000116352_59572224.pth
+[2023-03-09 16:19:29,002][744358] Saving new best policy, reward=596.829!
+[2023-03-09 16:19:30,099][744402] Updated weights for policy 0, policy_version 116960 (0.0005)
+[2023-03-09 16:19:33,954][744402] Updated weights for policy 0, policy_version 117040 (0.0005)
+[2023-03-09 16:19:33,995][744089] Fps is (10 sec: 10649.6, 60 sec: 9966.9, 300 sec: 9788.7). Total num frames: 59924480. Throughput: 0: 10061.9. Samples: 59922920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:33,996][744089] Avg episode reward: [(0, '597.602')]
+[2023-03-09 16:19:33,996][744358] Saving new best policy, reward=597.602!
+[2023-03-09 16:19:38,030][744402] Updated weights for policy 0, policy_version 117120 (0.0005)
+[2023-03-09 16:19:38,995][744089] Fps is (10 sec: 10240.2, 60 sec: 10035.2, 300 sec: 9802.6). Total num frames: 59973632. Throughput: 0: 10025.5. Samples: 59953680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:38,995][744089] Avg episode reward: [(0, '583.189')]
+[2023-03-09 16:19:42,131][744402] Updated weights for policy 0, policy_version 117200 (0.0005)
+[2023-03-09 16:19:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 10035.2, 300 sec: 9802.6). Total num frames: 60022784. Throughput: 0: 10066.2. Samples: 60013620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:43,996][744089] Avg episode reward: [(0, '595.801')]
+[2023-03-09 16:19:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000117232_60022784.pth...
+[2023-03-09 16:19:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000116640_59719680.pth
+[2023-03-09 16:19:46,148][744402] Updated weights for policy 0, policy_version 117280 (0.0005)
+[2023-03-09 16:19:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 10035.2, 300 sec: 9816.5). Total num frames: 60071936. Throughput: 0: 10030.7. Samples: 60072820. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:48,995][744089] Avg episode reward: [(0, '550.516')]
+[2023-03-09 16:19:50,265][744402] Updated weights for policy 0, policy_version 117360 (0.0005)
+[2023-03-09 16:19:53,995][744089] Fps is (10 sec: 9830.6, 60 sec: 10035.2, 300 sec: 9816.5). Total num frames: 60121088. Throughput: 0: 10065.8. Samples: 60104264. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:53,995][744089] Avg episode reward: [(0, '532.464')]
+[2023-03-09 16:19:54,396][744402] Updated weights for policy 0, policy_version 117440 (0.0004)
+[2023-03-09 16:19:58,429][744402] Updated weights for policy 0, policy_version 117520 (0.0004)
+[2023-03-09 16:19:58,995][744089] Fps is (10 sec: 10239.9, 60 sec: 10035.2, 300 sec: 9844.3). Total num frames: 60174336. Throughput: 0: 10076.9. Samples: 60162988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:19:58,995][744089] Avg episode reward: [(0, '570.726')]
+[2023-03-09 16:19:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000117528_60174336.pth...
+[2023-03-09 16:19:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000116936_59871232.pth
+[2023-03-09 16:20:02,873][744402] Updated weights for policy 0, policy_version 117600 (0.0004)
+[2023-03-09 16:20:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9966.9, 300 sec: 9844.3). Total num frames: 60219392. Throughput: 0: 10085.0. Samples: 60219520. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:20:03,995][744089] Avg episode reward: [(0, '461.111')]
+[2023-03-09 16:20:07,190][744402] Updated weights for policy 0, policy_version 117680 (0.0005)
+[2023-03-09 16:20:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9966.9, 300 sec: 9844.3). Total num frames: 60268544. Throughput: 0: 10011.0. Samples: 60248064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:20:08,995][744089] Avg episode reward: [(0, '384.617')]
+[2023-03-09 16:20:11,373][744402] Updated weights for policy 0, policy_version 117760 (0.0005)
+[2023-03-09 16:20:13,995][744089] Fps is (10 sec: 9830.1, 60 sec: 9966.9, 300 sec: 9844.3). Total num frames: 60317696. Throughput: 0: 9935.1. Samples: 60307172. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:20:13,996][744089] Avg episode reward: [(0, '475.023')]
+[2023-03-09 16:20:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000117808_60317696.pth...
+[2023-03-09 16:20:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000117232_60022784.pth
+[2023-03-09 16:20:15,645][744402] Updated weights for policy 0, policy_version 117840 (0.0005)
+[2023-03-09 16:20:18,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9966.9, 300 sec: 9844.3). Total num frames: 60362752. Throughput: 0: 9774.3. Samples: 60362764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:20:18,996][744089] Avg episode reward: [(0, '558.675')]
+[2023-03-09 16:20:20,088][744402] Updated weights for policy 0, policy_version 117920 (0.0005)
+[2023-03-09 16:20:23,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9898.7, 300 sec: 9844.3). Total num frames: 60411904. Throughput: 0: 9729.0. Samples: 60391488. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:20:23,996][744089] Avg episode reward: [(0, '558.477')]
+[2023-03-09 16:20:24,234][744402] Updated weights for policy 0, policy_version 118000 (0.0005)
+[2023-03-09 16:20:28,492][744402] Updated weights for policy 0, policy_version 118080 (0.0005)
+[2023-03-09 16:20:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9830.4). Total num frames: 60461056. Throughput: 0: 9718.9. Samples: 60450972. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:20:28,996][744089] Avg episode reward: [(0, '564.965')]
+[2023-03-09 16:20:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000118088_60461056.pth...
+[2023-03-09 16:20:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000117528_60174336.pth
+[2023-03-09 16:20:32,656][744402] Updated weights for policy 0, policy_version 118160 (0.0005)
+[2023-03-09 16:20:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9844.3). Total num frames: 60510208. Throughput: 0: 9709.7. Samples: 60509756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:20:33,996][744089] Avg episode reward: [(0, '545.254')]
+[2023-03-09 16:20:36,525][744402] Updated weights for policy 0, policy_version 118240 (0.0006)
+[2023-03-09 16:20:38,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9830.4, 300 sec: 9858.2). Total num frames: 60563456. Throughput: 0: 9734.0. Samples: 60542296. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:20:38,995][744089] Avg episode reward: [(0, '565.846')]
+[2023-03-09 16:20:40,657][744402] Updated weights for policy 0, policy_version 118320 (0.0005)
+[2023-03-09 16:20:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9844.3). Total num frames: 60608512. Throughput: 0: 9718.7. Samples: 60600328. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:20:43,995][744089] Avg episode reward: [(0, '534.189')]
+[2023-03-09 16:20:44,001][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000118384_60612608.pth...
+[2023-03-09 16:20:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000117808_60317696.pth
+[2023-03-09 16:20:44,932][744402] Updated weights for policy 0, policy_version 118400 (0.0005)
+[2023-03-09 16:20:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9858.2). Total num frames: 60657664. Throughput: 0: 9736.1. Samples: 60657644. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:20:48,995][744089] Avg episode reward: [(0, '527.652')]
+[2023-03-09 16:20:49,309][744402] Updated weights for policy 0, policy_version 118480 (0.0005)
+[2023-03-09 16:20:53,678][744402] Updated weights for policy 0, policy_version 118560 (0.0005)
+[2023-03-09 16:20:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9844.3). Total num frames: 60702720. Throughput: 0: 9737.3. Samples: 60686244. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:20:53,995][744089] Avg episode reward: [(0, '503.181')]
+[2023-03-09 16:20:57,937][744402] Updated weights for policy 0, policy_version 118640 (0.0005)
+[2023-03-09 16:20:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9844.3). Total num frames: 60751872. Throughput: 0: 9698.4. Samples: 60743596. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:20:58,996][744089] Avg episode reward: [(0, '521.675')]
+[2023-03-09 16:20:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000118656_60751872.pth...
+[2023-03-09 16:20:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000118088_60461056.pth
+[2023-03-09 16:21:02,095][744402] Updated weights for policy 0, policy_version 118720 (0.0005)
+[2023-03-09 16:21:03,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9858.2). Total num frames: 60805120. Throughput: 0: 9787.3. Samples: 60803192. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:21:03,995][744089] Avg episode reward: [(0, '483.063')]
+[2023-03-09 16:21:06,073][744402] Updated weights for policy 0, policy_version 118800 (0.0005)
+[2023-03-09 16:21:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9844.3). Total num frames: 60850176. Throughput: 0: 9821.3. Samples: 60833448. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:21:08,996][744089] Avg episode reward: [(0, '507.983')]
+[2023-03-09 16:21:10,381][744402] Updated weights for policy 0, policy_version 118880 (0.0005)
+[2023-03-09 16:21:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9844.3). Total num frames: 60899328. Throughput: 0: 9767.7. Samples: 60890520. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:21:13,996][744089] Avg episode reward: [(0, '447.820')]
+[2023-03-09 16:21:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000118944_60899328.pth...
+[2023-03-09 16:21:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000118384_60612608.pth
+[2023-03-09 16:21:14,728][744402] Updated weights for policy 0, policy_version 118960 (0.0005)
+[2023-03-09 16:21:18,870][744402] Updated weights for policy 0, policy_version 119040 (0.0005)
+[2023-03-09 16:21:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9844.3). Total num frames: 60948480. Throughput: 0: 9749.3. Samples: 60948476. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:21:18,995][744089] Avg episode reward: [(0, '506.081')]
+[2023-03-09 16:21:23,216][744402] Updated weights for policy 0, policy_version 119120 (0.0006)
+[2023-03-09 16:21:23,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9693.9, 300 sec: 9844.3). Total num frames: 60993536. Throughput: 0: 9662.1. Samples: 60977092. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:21:23,995][744089] Avg episode reward: [(0, '529.748')]
+[2023-03-09 16:21:27,489][744402] Updated weights for policy 0, policy_version 119200 (0.0005)
+[2023-03-09 16:21:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9844.3). Total num frames: 61042688. Throughput: 0: 9642.1. Samples: 61034224. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:21:28,995][744089] Avg episode reward: [(0, '531.634')]
+[2023-03-09 16:21:28,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000119224_61042688.pth...
+[2023-03-09 16:21:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000118656_60751872.pth
+[2023-03-09 16:21:31,365][744402] Updated weights for policy 0, policy_version 119280 (0.0004)
+[2023-03-09 16:21:33,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.2, 300 sec: 9858.2). Total num frames: 61095936. Throughput: 0: 9737.4. Samples: 61095824. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:21:33,995][744089] Avg episode reward: [(0, '535.256')]
+[2023-03-09 16:21:35,567][744402] Updated weights for policy 0, policy_version 119360 (0.0005)
+[2023-03-09 16:21:38,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9872.1). Total num frames: 61145088. Throughput: 0: 9743.0. Samples: 61124680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:21:38,995][744089] Avg episode reward: [(0, '567.796')]
+[2023-03-09 16:21:39,738][744402] Updated weights for policy 0, policy_version 119440 (0.0005)
+[2023-03-09 16:21:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9858.2). Total num frames: 61190144. Throughput: 0: 9741.3. Samples: 61181952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:21:43,996][744089] Avg episode reward: [(0, '493.419')]
+[2023-03-09 16:21:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000119512_61190144.pth...
+[2023-03-09 16:21:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000118944_60899328.pth
+[2023-03-09 16:21:44,150][744402] Updated weights for policy 0, policy_version 119520 (0.0005)
+[2023-03-09 16:21:48,415][744402] Updated weights for policy 0, policy_version 119600 (0.0005)
+[2023-03-09 16:21:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9858.2). Total num frames: 61239296. Throughput: 0: 9692.6. Samples: 61239360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:21:48,996][744089] Avg episode reward: [(0, '427.276')]
+[2023-03-09 16:21:52,804][744402] Updated weights for policy 0, policy_version 119680 (0.0005)
+[2023-03-09 16:21:53,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9844.3). Total num frames: 61288448. Throughput: 0: 9655.0. Samples: 61267924. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:21:53,996][744089] Avg episode reward: [(0, '523.955')]
+[2023-03-09 16:21:56,738][744402] Updated weights for policy 0, policy_version 119760 (0.0005)
+[2023-03-09 16:21:58,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9816.5). Total num frames: 61333504. Throughput: 0: 9708.9. Samples: 61327420. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:21:58,995][744089] Avg episode reward: [(0, '517.724')]
+[2023-03-09 16:21:58,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000119800_61337600.pth...
+[2023-03-09 16:21:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000119224_61042688.pth
+[2023-03-09 16:22:00,852][744402] Updated weights for policy 0, policy_version 119840 (0.0005)
+[2023-03-09 16:22:03,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9830.4). Total num frames: 61386752. Throughput: 0: 9738.9. Samples: 61386728. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:22:03,995][744089] Avg episode reward: [(0, '520.343')]
+[2023-03-09 16:22:05,085][744402] Updated weights for policy 0, policy_version 119920 (0.0006)
+[2023-03-09 16:22:08,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9762.1, 300 sec: 9816.5). Total num frames: 61435904. Throughput: 0: 9766.6. Samples: 61416588. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:22:08,996][744089] Avg episode reward: [(0, '509.428')]
+[2023-03-09 16:22:09,174][744402] Updated weights for policy 0, policy_version 120000 (0.0005)
+[2023-03-09 16:22:13,229][744402] Updated weights for policy 0, policy_version 120080 (0.0005)
+[2023-03-09 16:22:13,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.2, 300 sec: 9816.5). Total num frames: 61485056. Throughput: 0: 9836.6. Samples: 61476872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:22:13,995][744089] Avg episode reward: [(0, '535.530')]
+[2023-03-09 16:22:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000120088_61485056.pth...
+[2023-03-09 16:22:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000119512_61190144.pth
+[2023-03-09 16:22:17,500][744402] Updated weights for policy 0, policy_version 120160 (0.0005)
+[2023-03-09 16:22:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9830.4). Total num frames: 61534208. Throughput: 0: 9743.4. Samples: 61534280. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:22:18,996][744089] Avg episode reward: [(0, '504.049')]
+[2023-03-09 16:22:21,757][744402] Updated weights for policy 0, policy_version 120240 (0.0005)
+[2023-03-09 16:22:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9830.4). Total num frames: 61583360. Throughput: 0: 9742.2. Samples: 61563080. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:22:23,995][744089] Avg episode reward: [(0, '505.740')]
+[2023-03-09 16:22:25,826][744402] Updated weights for policy 0, policy_version 120320 (0.0006)
+[2023-03-09 16:22:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9830.4). Total num frames: 61632512. Throughput: 0: 9798.6. Samples: 61622888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:22:28,996][744089] Avg episode reward: [(0, '522.995')]
+[2023-03-09 16:22:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000120376_61632512.pth...
+[2023-03-09 16:22:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000119800_61337600.pth
+[2023-03-09 16:22:30,227][744402] Updated weights for policy 0, policy_version 120400 (0.0005)
+[2023-03-09 16:22:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9816.5). Total num frames: 61677568. Throughput: 0: 9741.0. Samples: 61677704. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:22:33,995][744089] Avg episode reward: [(0, '537.466')]
+[2023-03-09 16:22:34,667][744402] Updated weights for policy 0, policy_version 120480 (0.0005)
+[2023-03-09 16:22:38,954][744402] Updated weights for policy 0, policy_version 120560 (0.0005)
+[2023-03-09 16:22:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9816.5). Total num frames: 61726720. Throughput: 0: 9744.6. Samples: 61706432. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:22:38,996][744089] Avg episode reward: [(0, '494.747')]
+[2023-03-09 16:22:42,979][744402] Updated weights for policy 0, policy_version 120640 (0.0005)
+[2023-03-09 16:22:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9816.5). Total num frames: 61775872. Throughput: 0: 9753.6. Samples: 61766332. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:22:43,996][744089] Avg episode reward: [(0, '492.325')]
+[2023-03-09 16:22:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000120656_61775872.pth...
+[2023-03-09 16:22:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000120088_61485056.pth
+[2023-03-09 16:22:47,187][744402] Updated weights for policy 0, policy_version 120720 (0.0005)
+[2023-03-09 16:22:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 61820928. Throughput: 0: 9709.6. Samples: 61823660. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:22:48,995][744089] Avg episode reward: [(0, '512.120')]
+[2023-03-09 16:22:51,455][744402] Updated weights for policy 0, policy_version 120800 (0.0005)
+[2023-03-09 16:22:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9802.6). Total num frames: 61870080. Throughput: 0: 9711.9. Samples: 61853624. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:22:53,996][744089] Avg episode reward: [(0, '512.705')]
+[2023-03-09 16:22:55,755][744402] Updated weights for policy 0, policy_version 120880 (0.0005)
+[2023-03-09 16:22:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 61919232. Throughput: 0: 9644.7. Samples: 61910884. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:22:58,996][744089] Avg episode reward: [(0, '479.654')]
+[2023-03-09 16:22:59,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000120936_61919232.pth...
+[2023-03-09 16:22:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000120376_61632512.pth
+[2023-03-09 16:22:59,907][744402] Updated weights for policy 0, policy_version 120960 (0.0005)
+[2023-03-09 16:23:03,745][744402] Updated weights for policy 0, policy_version 121040 (0.0005)
+[2023-03-09 16:23:03,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9816.5). Total num frames: 61972480. Throughput: 0: 9744.7. Samples: 61972792. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:23:03,995][744089] Avg episode reward: [(0, '426.610')]
+[2023-03-09 16:23:08,126][744402] Updated weights for policy 0, policy_version 121120 (0.0005)
+[2023-03-09 16:23:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9802.6). Total num frames: 62017536. Throughput: 0: 9738.5. Samples: 62001312. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:23:08,996][744089] Avg episode reward: [(0, '465.538')]
+[2023-03-09 16:23:12,476][744402] Updated weights for policy 0, policy_version 121200 (0.0004)
+[2023-03-09 16:23:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9802.6). Total num frames: 62066688. Throughput: 0: 9678.4. Samples: 62058416. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:23:13,995][744089] Avg episode reward: [(0, '437.949')]
+[2023-03-09 16:23:13,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000121224_62066688.pth...
+[2023-03-09 16:23:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000120656_61775872.pth
+[2023-03-09 16:23:16,669][744402] Updated weights for policy 0, policy_version 121280 (0.0005)
+[2023-03-09 16:23:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 62115840. Throughput: 0: 9739.1. Samples: 62115964. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:23:18,995][744089] Avg episode reward: [(0, '453.748')]
+[2023-03-09 16:23:20,951][744402] Updated weights for policy 0, policy_version 121360 (0.0005)
+[2023-03-09 16:23:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 62164992. Throughput: 0: 9744.0. Samples: 62144912. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:23:23,996][744089] Avg episode reward: [(0, '467.726')]
+[2023-03-09 16:23:24,949][744402] Updated weights for policy 0, policy_version 121440 (0.0004)
+[2023-03-09 16:23:28,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 62214144. Throughput: 0: 9734.2. Samples: 62204368. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:23:28,995][744089] Avg episode reward: [(0, '451.481')]
+[2023-03-09 16:23:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000121512_62214144.pth...
+[2023-03-09 16:23:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000120936_61919232.pth
+[2023-03-09 16:23:29,194][744402] Updated weights for policy 0, policy_version 121520 (0.0005)
+[2023-03-09 16:23:33,289][744402] Updated weights for policy 0, policy_version 121600 (0.0005)
+[2023-03-09 16:23:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 62263296. Throughput: 0: 9778.0. Samples: 62263672. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:23:33,996][744089] Avg episode reward: [(0, '466.563')]
+[2023-03-09 16:23:37,546][744402] Updated weights for policy 0, policy_version 121680 (0.0005)
+[2023-03-09 16:23:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 62312448. Throughput: 0: 9763.1. Samples: 62292964. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:23:38,995][744089] Avg episode reward: [(0, '487.773')]
+[2023-03-09 16:23:41,925][744402] Updated weights for policy 0, policy_version 121760 (0.0005)
+[2023-03-09 16:23:43,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 62361600. Throughput: 0: 9759.5. Samples: 62350060. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:23:43,996][744089] Avg episode reward: [(0, '453.143')]
+[2023-03-09 16:23:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000121800_62361600.pth...
+[2023-03-09 16:23:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000121224_62066688.pth
+[2023-03-09 16:23:45,994][744402] Updated weights for policy 0, policy_version 121840 (0.0005)
+[2023-03-09 16:23:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9802.6). Total num frames: 62410752. Throughput: 0: 9732.1. Samples: 62410736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:23:48,995][744089] Avg episode reward: [(0, '489.815')]
+[2023-03-09 16:23:50,227][744402] Updated weights for policy 0, policy_version 121920 (0.0005)
+[2023-03-09 16:23:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9774.9). Total num frames: 62455808. Throughput: 0: 9709.2. Samples: 62438228. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:23:53,996][744089] Avg episode reward: [(0, '486.660')]
+[2023-03-09 16:23:54,566][744402] Updated weights for policy 0, policy_version 122000 (0.0005)
+[2023-03-09 16:23:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 62500864. Throughput: 0: 9651.6. Samples: 62492736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:23:58,995][744089] Avg episode reward: [(0, '528.182')]
+[2023-03-09 16:23:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000122072_62500864.pth...
+[2023-03-09 16:23:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000121512_62214144.pth
+[2023-03-09 16:23:59,043][744402] Updated weights for policy 0, policy_version 122080 (0.0005)
+[2023-03-09 16:24:03,697][744402] Updated weights for policy 0, policy_version 122160 (0.0006)
+[2023-03-09 16:24:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9557.3, 300 sec: 9747.1). Total num frames: 62545920. Throughput: 0: 9574.0. Samples: 62546796. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:03,996][744089] Avg episode reward: [(0, '499.320')]
+[2023-03-09 16:24:08,435][744402] Updated weights for policy 0, policy_version 122240 (0.0006)
+[2023-03-09 16:24:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9557.3, 300 sec: 9733.2). Total num frames: 62590976. Throughput: 0: 9503.3. Samples: 62572560. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:08,995][744089] Avg episode reward: [(0, '503.071')]
+[2023-03-09 16:24:12,767][744402] Updated weights for policy 0, policy_version 122320 (0.0005)
+[2023-03-09 16:24:13,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9489.1, 300 sec: 9733.2). Total num frames: 62636032. Throughput: 0: 9412.1. Samples: 62627912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:13,996][744089] Avg episode reward: [(0, '473.223')]
+[2023-03-09 16:24:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000122336_62636032.pth...
+[2023-03-09 16:24:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000121800_62361600.pth
+[2023-03-09 16:24:17,017][744402] Updated weights for policy 0, policy_version 122400 (0.0005)
+[2023-03-09 16:24:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9719.3). Total num frames: 62685184. Throughput: 0: 9374.2. Samples: 62685512. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:18,996][744089] Avg episode reward: [(0, '509.696')]
+[2023-03-09 16:24:21,313][744402] Updated weights for policy 0, policy_version 122480 (0.0005)
+[2023-03-09 16:24:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9705.4). Total num frames: 62734336. Throughput: 0: 9368.7. Samples: 62714556. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:23,995][744089] Avg episode reward: [(0, '462.546')]
+[2023-03-09 16:24:25,498][744402] Updated weights for policy 0, policy_version 122560 (0.0005)
+[2023-03-09 16:24:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9691.6). Total num frames: 62783488. Throughput: 0: 9397.3. Samples: 62772936. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:28,996][744089] Avg episode reward: [(0, '479.343')]
+[2023-03-09 16:24:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000122624_62783488.pth...
+[2023-03-09 16:24:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000122072_62500864.pth
+[2023-03-09 16:24:29,836][744402] Updated weights for policy 0, policy_version 122640 (0.0005)
+[2023-03-09 16:24:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9677.7). Total num frames: 62828544. Throughput: 0: 9316.7. Samples: 62829988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:33,995][744089] Avg episode reward: [(0, '523.893')]
+[2023-03-09 16:24:34,110][744402] Updated weights for policy 0, policy_version 122720 (0.0005)
+[2023-03-09 16:24:38,210][744402] Updated weights for policy 0, policy_version 122800 (0.0005)
+[2023-03-09 16:24:38,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.0, 300 sec: 9691.6). Total num frames: 62881792. Throughput: 0: 9348.2. Samples: 62858896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:38,996][744089] Avg episode reward: [(0, '536.381')]
+[2023-03-09 16:24:42,193][744402] Updated weights for policy 0, policy_version 122880 (0.0005)
+[2023-03-09 16:24:43,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9489.1, 300 sec: 9691.5). Total num frames: 62930944. Throughput: 0: 9503.4. Samples: 62920388. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:43,996][744089] Avg episode reward: [(0, '534.935')]
+[2023-03-09 16:24:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000122912_62930944.pth...
+[2023-03-09 16:24:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000122336_62636032.pth
+[2023-03-09 16:24:46,544][744402] Updated weights for policy 0, policy_version 122960 (0.0005)
+[2023-03-09 16:24:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9677.7). Total num frames: 62976000. Throughput: 0: 9586.9. Samples: 62978204. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:48,995][744089] Avg episode reward: [(0, '506.956')]
+[2023-03-09 16:24:50,789][744402] Updated weights for policy 0, policy_version 123040 (0.0005)
+[2023-03-09 16:24:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9663.8). Total num frames: 63025152. Throughput: 0: 9647.7. Samples: 63006708. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:53,995][744089] Avg episode reward: [(0, '517.646')]
+[2023-03-09 16:24:55,025][744402] Updated weights for policy 0, policy_version 123120 (0.0005)
+[2023-03-09 16:24:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9677.7). Total num frames: 63074304. Throughput: 0: 9734.5. Samples: 63065964. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:24:58,996][744089] Avg episode reward: [(0, '524.717')]
+[2023-03-09 16:24:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000123192_63074304.pth...
+[2023-03-09 16:24:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000122624_62783488.pth
+[2023-03-09 16:24:59,224][744402] Updated weights for policy 0, policy_version 123200 (0.0005)
+[2023-03-09 16:25:03,459][744402] Updated weights for policy 0, policy_version 123280 (0.0005)
+[2023-03-09 16:25:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 63123456. Throughput: 0: 9731.7. Samples: 63123436. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:03,995][744089] Avg episode reward: [(0, '507.798')]
+[2023-03-09 16:25:07,641][744402] Updated weights for policy 0, policy_version 123360 (0.0005)
+[2023-03-09 16:25:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 63168512. Throughput: 0: 9725.2. Samples: 63152192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:08,996][744089] Avg episode reward: [(0, '513.626')]
+[2023-03-09 16:25:11,820][744402] Updated weights for policy 0, policy_version 123440 (0.0005)
+[2023-03-09 16:25:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 63217664. Throughput: 0: 9721.3. Samples: 63210396. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:13,996][744089] Avg episode reward: [(0, '521.640')]
+[2023-03-09 16:25:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000123472_63217664.pth...
+[2023-03-09 16:25:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000122912_62930944.pth
+[2023-03-09 16:25:16,324][744402] Updated weights for policy 0, policy_version 123520 (0.0004)
+[2023-03-09 16:25:18,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 63266816. Throughput: 0: 9681.4. Samples: 63265652. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:18,995][744089] Avg episode reward: [(0, '370.209')]
+[2023-03-09 16:25:20,660][744402] Updated weights for policy 0, policy_version 123600 (0.0005)
+[2023-03-09 16:25:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 63311872. Throughput: 0: 9675.8. Samples: 63294304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:23,995][744089] Avg episode reward: [(0, '480.824')]
+[2023-03-09 16:25:24,877][744402] Updated weights for policy 0, policy_version 123680 (0.0005)
+[2023-03-09 16:25:28,684][744402] Updated weights for policy 0, policy_version 123760 (0.0005)
+[2023-03-09 16:25:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 63365120. Throughput: 0: 9662.9. Samples: 63355220. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:28,995][744089] Avg episode reward: [(0, '476.744')]
+[2023-03-09 16:25:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000123760_63365120.pth...
+[2023-03-09 16:25:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000123192_63074304.pth
+[2023-03-09 16:25:32,871][744402] Updated weights for policy 0, policy_version 123840 (0.0005)
+[2023-03-09 16:25:33,995][744089] Fps is (10 sec: 10649.5, 60 sec: 9830.4, 300 sec: 9677.7). Total num frames: 63418368. Throughput: 0: 9762.6. Samples: 63417524. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:33,996][744089] Avg episode reward: [(0, '506.524')]
+[2023-03-09 16:25:36,897][744402] Updated weights for policy 0, policy_version 123920 (0.0005)
+[2023-03-09 16:25:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 63463424. Throughput: 0: 9779.6. Samples: 63446792. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:38,995][744089] Avg episode reward: [(0, '540.181')]
+[2023-03-09 16:25:41,261][744402] Updated weights for policy 0, policy_version 124000 (0.0004)
+[2023-03-09 16:25:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 63512576. Throughput: 0: 9733.0. Samples: 63503948. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:43,996][744089] Avg episode reward: [(0, '519.726')]
+[2023-03-09 16:25:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000124048_63512576.pth...
+[2023-03-09 16:25:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000123472_63217664.pth
+[2023-03-09 16:25:45,415][744402] Updated weights for policy 0, policy_version 124080 (0.0005)
+[2023-03-09 16:25:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 63561728. Throughput: 0: 9723.0. Samples: 63560972. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:48,996][744089] Avg episode reward: [(0, '531.337')]
+[2023-03-09 16:25:49,889][744402] Updated weights for policy 0, policy_version 124160 (0.0005)
+[2023-03-09 16:25:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 63606784. Throughput: 0: 9721.3. Samples: 63589648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:53,995][744089] Avg episode reward: [(0, '517.242')]
+[2023-03-09 16:25:54,101][744402] Updated weights for policy 0, policy_version 124240 (0.0005)
+[2023-03-09 16:25:58,513][744402] Updated weights for policy 0, policy_version 124320 (0.0005)
+[2023-03-09 16:25:58,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 63655936. Throughput: 0: 9671.2. Samples: 63645600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:25:58,995][744089] Avg episode reward: [(0, '462.171')]
+[2023-03-09 16:25:58,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000124328_63655936.pth...
+[2023-03-09 16:25:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000123760_63365120.pth
+[2023-03-09 16:26:02,797][744402] Updated weights for policy 0, policy_version 124400 (0.0005)
+[2023-03-09 16:26:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 63700992. Throughput: 0: 9693.7. Samples: 63701868. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:03,995][744089] Avg episode reward: [(0, '517.772')]
+[2023-03-09 16:26:07,088][744402] Updated weights for policy 0, policy_version 124480 (0.0005)
+[2023-03-09 16:26:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 63750144. Throughput: 0: 9695.9. Samples: 63730620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:08,995][744089] Avg episode reward: [(0, '523.755')]
+[2023-03-09 16:26:11,445][744402] Updated weights for policy 0, policy_version 124560 (0.0005)
+[2023-03-09 16:26:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 63799296. Throughput: 0: 9613.7. Samples: 63787836. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:13,996][744089] Avg episode reward: [(0, '521.351')]
+[2023-03-09 16:26:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000124608_63799296.pth...
+[2023-03-09 16:26:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000124048_63512576.pth
+[2023-03-09 16:26:15,637][744402] Updated weights for policy 0, policy_version 124640 (0.0005)
+[2023-03-09 16:26:18,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 63844352. Throughput: 0: 9547.9. Samples: 63847180. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:18,995][744089] Avg episode reward: [(0, '527.820')]
+[2023-03-09 16:26:19,817][744402] Updated weights for policy 0, policy_version 124720 (0.0005)
+[2023-03-09 16:26:23,769][744402] Updated weights for policy 0, policy_version 124800 (0.0005)
+[2023-03-09 16:26:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9677.7). Total num frames: 63897600. Throughput: 0: 9562.9. Samples: 63877120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:23,995][744089] Avg episode reward: [(0, '538.401')]
+[2023-03-09 16:26:28,025][744402] Updated weights for policy 0, policy_version 124880 (0.0005)
+[2023-03-09 16:26:28,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 63946752. Throughput: 0: 9621.5. Samples: 63936916. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:28,996][744089] Avg episode reward: [(0, '522.292')]
+[2023-03-09 16:26:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000124896_63946752.pth...
+[2023-03-09 16:26:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000124328_63655936.pth
+[2023-03-09 16:26:32,225][744402] Updated weights for policy 0, policy_version 124960 (0.0005)
+[2023-03-09 16:26:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 63995904. Throughput: 0: 9663.9. Samples: 63995848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:33,995][744089] Avg episode reward: [(0, '538.255')]
+[2023-03-09 16:26:36,403][744402] Updated weights for policy 0, policy_version 125040 (0.0005)
+[2023-03-09 16:26:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 64045056. Throughput: 0: 9662.5. Samples: 64024460. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:38,995][744089] Avg episode reward: [(0, '499.833')]
+[2023-03-09 16:26:40,622][744402] Updated weights for policy 0, policy_version 125120 (0.0004)
+[2023-03-09 16:26:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 64094208. Throughput: 0: 9710.9. Samples: 64082592. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:43,995][744089] Avg episode reward: [(0, '500.564')]
+[2023-03-09 16:26:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000125184_64094208.pth...
+[2023-03-09 16:26:44,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000124608_63799296.pth
+[2023-03-09 16:26:44,829][744402] Updated weights for policy 0, policy_version 125200 (0.0005)
+[2023-03-09 16:26:48,991][744402] Updated weights for policy 0, policy_version 125280 (0.0005)
+[2023-03-09 16:26:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 64143360. Throughput: 0: 9794.4. Samples: 64142616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:48,995][744089] Avg episode reward: [(0, '484.630')]
+[2023-03-09 16:26:53,101][744402] Updated weights for policy 0, policy_version 125360 (0.0004)
+[2023-03-09 16:26:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 64192512. Throughput: 0: 9786.4. Samples: 64171008. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:53,995][744089] Avg episode reward: [(0, '503.837')]
+[2023-03-09 16:26:57,374][744402] Updated weights for policy 0, policy_version 125440 (0.0005)
+[2023-03-09 16:26:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.8, 300 sec: 9663.8). Total num frames: 64237568. Throughput: 0: 9813.4. Samples: 64229440. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:26:58,996][744089] Avg episode reward: [(0, '415.061')]
+[2023-03-09 16:26:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000125464_64237568.pth...
+[2023-03-09 16:26:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000124896_63946752.pth
+[2023-03-09 16:27:01,482][744402] Updated weights for policy 0, policy_version 125520 (0.0005)
+[2023-03-09 16:27:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 64286720. Throughput: 0: 9821.7. Samples: 64289156. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:03,995][744089] Avg episode reward: [(0, '485.919')]
+[2023-03-09 16:27:05,647][744402] Updated weights for policy 0, policy_version 125600 (0.0006)
+[2023-03-09 16:27:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 64335872. Throughput: 0: 9822.8. Samples: 64319148. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:08,995][744089] Avg episode reward: [(0, '482.984')]
+[2023-03-09 16:27:09,771][744402] Updated weights for policy 0, policy_version 125680 (0.0005)
+[2023-03-09 16:27:13,880][744402] Updated weights for policy 0, policy_version 125760 (0.0005)
+[2023-03-09 16:27:13,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9830.4, 300 sec: 9677.7). Total num frames: 64389120. Throughput: 0: 9810.3. Samples: 64378380. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:13,996][744089] Avg episode reward: [(0, '515.042')]
+[2023-03-09 16:27:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000125760_64389120.pth...
+[2023-03-09 16:27:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000125184_64094208.pth
+[2023-03-09 16:27:18,192][744402] Updated weights for policy 0, policy_version 125840 (0.0005)
+[2023-03-09 16:27:18,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9677.7). Total num frames: 64438272. Throughput: 0: 9800.3. Samples: 64436860. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:18,995][744089] Avg episode reward: [(0, '528.175')]
+[2023-03-09 16:27:22,225][744402] Updated weights for policy 0, policy_version 125920 (0.0005)
+[2023-03-09 16:27:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9677.7). Total num frames: 64487424. Throughput: 0: 9834.4. Samples: 64467008. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:23,995][744089] Avg episode reward: [(0, '542.919')]
+[2023-03-09 16:27:26,650][744402] Updated weights for policy 0, policy_version 126000 (0.0005)
+[2023-03-09 16:27:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9677.7). Total num frames: 64532480. Throughput: 0: 9808.4. Samples: 64523968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:28,996][744089] Avg episode reward: [(0, '502.156')]
+[2023-03-09 16:27:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000126040_64532480.pth...
+[2023-03-09 16:27:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000125464_64237568.pth
+[2023-03-09 16:27:30,975][744402] Updated weights for policy 0, policy_version 126080 (0.0005)
+[2023-03-09 16:27:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9762.2, 300 sec: 9677.7). Total num frames: 64581632. Throughput: 0: 9757.3. Samples: 64581696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:33,995][744089] Avg episode reward: [(0, '451.026')]
+[2023-03-09 16:27:34,929][744402] Updated weights for policy 0, policy_version 126160 (0.0005)
+[2023-03-09 16:27:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9677.7). Total num frames: 64630784. Throughput: 0: 9769.2. Samples: 64610624. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:38,995][744089] Avg episode reward: [(0, '491.781')]
+[2023-03-09 16:27:39,352][744402] Updated weights for policy 0, policy_version 126240 (0.0005)
+[2023-03-09 16:27:43,704][744402] Updated weights for policy 0, policy_version 126320 (0.0004)
+[2023-03-09 16:27:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 64675840. Throughput: 0: 9738.0. Samples: 64667648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:43,995][744089] Avg episode reward: [(0, '504.459')]
+[2023-03-09 16:27:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000126320_64675840.pth...
+[2023-03-09 16:27:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000125760_64389120.pth
+[2023-03-09 16:27:47,937][744402] Updated weights for policy 0, policy_version 126400 (0.0005)
+[2023-03-09 16:27:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 64724992. Throughput: 0: 9685.4. Samples: 64725000. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:48,996][744089] Avg episode reward: [(0, '477.257')]
+[2023-03-09 16:27:52,357][744402] Updated weights for policy 0, policy_version 126480 (0.0005)
+[2023-03-09 16:27:53,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.8, 300 sec: 9677.7). Total num frames: 64774144. Throughput: 0: 9652.4. Samples: 64753508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:53,995][744089] Avg episode reward: [(0, '503.487')]
+[2023-03-09 16:27:56,332][744402] Updated weights for policy 0, policy_version 126560 (0.0005)
+[2023-03-09 16:27:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 64823296. Throughput: 0: 9640.3. Samples: 64812196. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:27:58,996][744089] Avg episode reward: [(0, '520.959')]
+[2023-03-09 16:27:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000126608_64823296.pth...
+[2023-03-09 16:27:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000126040_64532480.pth
+[2023-03-09 16:28:00,488][744402] Updated weights for policy 0, policy_version 126640 (0.0005)
+[2023-03-09 16:28:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 64868352. Throughput: 0: 9655.8. Samples: 64871372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:03,995][744089] Avg episode reward: [(0, '554.482')]
+[2023-03-09 16:28:04,912][744402] Updated weights for policy 0, policy_version 126720 (0.0005)
+[2023-03-09 16:28:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 64917504. Throughput: 0: 9603.5. Samples: 64899168. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:08,996][744089] Avg episode reward: [(0, '520.016')]
+[2023-03-09 16:28:09,168][744402] Updated weights for policy 0, policy_version 126800 (0.0005)
+[2023-03-09 16:28:13,360][744402] Updated weights for policy 0, policy_version 126880 (0.0005)
+[2023-03-09 16:28:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 64966656. Throughput: 0: 9651.8. Samples: 64958300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:13,995][744089] Avg episode reward: [(0, '498.332')]
+[2023-03-09 16:28:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000126888_64966656.pth...
+[2023-03-09 16:28:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000126320_64675840.pth
+[2023-03-09 16:28:17,691][744402] Updated weights for policy 0, policy_version 126960 (0.0005)
+[2023-03-09 16:28:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 65015808. Throughput: 0: 9646.9. Samples: 65015808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:18,995][744089] Avg episode reward: [(0, '490.949')]
+[2023-03-09 16:28:21,777][744402] Updated weights for policy 0, policy_version 127040 (0.0004)
+[2023-03-09 16:28:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 65064960. Throughput: 0: 9642.8. Samples: 65044552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:23,995][744089] Avg episode reward: [(0, '539.330')]
+[2023-03-09 16:28:26,087][744402] Updated weights for policy 0, policy_version 127120 (0.0005)
+[2023-03-09 16:28:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 65110016. Throughput: 0: 9649.8. Samples: 65101888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:28,995][744089] Avg episode reward: [(0, '541.252')]
+[2023-03-09 16:28:29,049][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000127176_65114112.pth...
+[2023-03-09 16:28:29,051][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000126608_64823296.pth
+[2023-03-09 16:28:30,322][744402] Updated weights for policy 0, policy_version 127200 (0.0005)
+[2023-03-09 16:28:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 65159168. Throughput: 0: 9667.7. Samples: 65160048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:33,995][744089] Avg episode reward: [(0, '555.658')]
+[2023-03-09 16:28:34,560][744402] Updated weights for policy 0, policy_version 127280 (0.0005)
+[2023-03-09 16:28:38,787][744402] Updated weights for policy 0, policy_version 127360 (0.0005)
+[2023-03-09 16:28:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 65208320. Throughput: 0: 9731.0. Samples: 65191404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:38,995][744089] Avg episode reward: [(0, '544.058')]
+[2023-03-09 16:28:43,208][744402] Updated weights for policy 0, policy_version 127440 (0.0005)
+[2023-03-09 16:28:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 65253376. Throughput: 0: 9633.4. Samples: 65245696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:43,995][744089] Avg episode reward: [(0, '519.254')]
+[2023-03-09 16:28:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000127448_65253376.pth...
+[2023-03-09 16:28:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000126888_64966656.pth
+[2023-03-09 16:28:47,468][744402] Updated weights for policy 0, policy_version 127520 (0.0005)
+[2023-03-09 16:28:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 65302528. Throughput: 0: 9579.0. Samples: 65302424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:48,995][744089] Avg episode reward: [(0, '526.130')]
+[2023-03-09 16:28:51,907][744402] Updated weights for policy 0, policy_version 127600 (0.0005)
+[2023-03-09 16:28:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.4, 300 sec: 9649.9). Total num frames: 65347584. Throughput: 0: 9592.7. Samples: 65330840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:53,995][744089] Avg episode reward: [(0, '532.968')]
+[2023-03-09 16:28:56,147][744402] Updated weights for policy 0, policy_version 127680 (0.0005)
+[2023-03-09 16:28:58,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 65396736. Throughput: 0: 9561.0. Samples: 65388544. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:28:58,996][744089] Avg episode reward: [(0, '554.274')]
+[2023-03-09 16:28:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000127728_65396736.pth...
+[2023-03-09 16:28:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000127176_65114112.pth
+[2023-03-09 16:29:00,380][744402] Updated weights for policy 0, policy_version 127760 (0.0005)
+[2023-03-09 16:29:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 65445888. Throughput: 0: 9605.7. Samples: 65448064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:03,995][744089] Avg episode reward: [(0, '532.608')]
+[2023-03-09 16:29:04,535][744402] Updated weights for policy 0, policy_version 127840 (0.0005)
+[2023-03-09 16:29:08,692][744402] Updated weights for policy 0, policy_version 127920 (0.0005)
+[2023-03-09 16:29:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9691.6). Total num frames: 65495040. Throughput: 0: 9586.4. Samples: 65475940. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:08,995][744089] Avg episode reward: [(0, '461.355')]
+[2023-03-09 16:29:12,698][744402] Updated weights for policy 0, policy_version 128000 (0.0005)
+[2023-03-09 16:29:13,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 65548288. Throughput: 0: 9666.9. Samples: 65536900. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:13,995][744089] Avg episode reward: [(0, '542.372')]
+[2023-03-09 16:29:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000128024_65548288.pth...
+[2023-03-09 16:29:13,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000127448_65253376.pth
+[2023-03-09 16:29:16,905][744402] Updated weights for policy 0, policy_version 128080 (0.0005)
+[2023-03-09 16:29:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9691.6). Total num frames: 65593344. Throughput: 0: 9656.1. Samples: 65594572. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:18,996][744089] Avg episode reward: [(0, '533.439')]
+[2023-03-09 16:29:21,188][744402] Updated weights for policy 0, policy_version 128160 (0.0005)
+[2023-03-09 16:29:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 65646592. Throughput: 0: 9599.9. Samples: 65623400. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:23,995][744089] Avg episode reward: [(0, '544.828')]
+[2023-03-09 16:29:25,264][744402] Updated weights for policy 0, policy_version 128240 (0.0005)
+[2023-03-09 16:29:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 65691648. Throughput: 0: 9701.6. Samples: 65682268. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:28,996][744089] Avg episode reward: [(0, '529.103')]
+[2023-03-09 16:29:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000128304_65691648.pth...
+[2023-03-09 16:29:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000127728_65396736.pth
+[2023-03-09 16:29:29,805][744402] Updated weights for policy 0, policy_version 128320 (0.0005)
+[2023-03-09 16:29:33,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 65736704. Throughput: 0: 9690.4. Samples: 65738492. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:33,996][744089] Avg episode reward: [(0, '501.031')]
+[2023-03-09 16:29:34,067][744402] Updated weights for policy 0, policy_version 128400 (0.0005)
+[2023-03-09 16:29:38,119][744402] Updated weights for policy 0, policy_version 128480 (0.0005)
+[2023-03-09 16:29:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 65789952. Throughput: 0: 9725.3. Samples: 65768480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:38,995][744089] Avg episode reward: [(0, '531.377')]
+[2023-03-09 16:29:42,373][744402] Updated weights for policy 0, policy_version 128560 (0.0005)
+[2023-03-09 16:29:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9691.5). Total num frames: 65835008. Throughput: 0: 9739.4. Samples: 65826816. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:43,995][744089] Avg episode reward: [(0, '487.642')]
+[2023-03-09 16:29:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000128584_65835008.pth...
+[2023-03-09 16:29:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000128024_65548288.pth
+[2023-03-09 16:29:46,935][744402] Updated weights for policy 0, policy_version 128640 (0.0006)
+[2023-03-09 16:29:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.8, 300 sec: 9691.6). Total num frames: 65884160. Throughput: 0: 9684.3. Samples: 65883856. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:29:48,996][744089] Avg episode reward: [(0, '475.074')]
+[2023-03-09 16:29:51,108][744402] Updated weights for policy 0, policy_version 128720 (0.0005)
+[2023-03-09 16:29:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 65929216. Throughput: 0: 9682.4. Samples: 65911648. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:29:53,995][744089] Avg episode reward: [(0, '446.812')]
+[2023-03-09 16:29:55,437][744402] Updated weights for policy 0, policy_version 128800 (0.0004)
+[2023-03-09 16:29:58,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 65974272. Throughput: 0: 9571.1. Samples: 65967600. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:29:58,995][744089] Avg episode reward: [(0, '377.267')]
+[2023-03-09 16:29:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000128856_65974272.pth...
+[2023-03-09 16:29:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000128304_65691648.pth
+[2023-03-09 16:29:59,928][744402] Updated weights for policy 0, policy_version 128880 (0.0005)
+[2023-03-09 16:30:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 66023424. Throughput: 0: 9583.0. Samples: 66025808. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:03,995][744089] Avg episode reward: [(0, '374.264')]
+[2023-03-09 16:30:04,050][744402] Updated weights for policy 0, policy_version 128960 (0.0006)
+[2023-03-09 16:30:08,343][744402] Updated weights for policy 0, policy_version 129040 (0.0005)
+[2023-03-09 16:30:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 66072576. Throughput: 0: 9566.1. Samples: 66053876. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:08,996][744089] Avg episode reward: [(0, '431.667')]
+[2023-03-09 16:30:12,663][744402] Updated weights for policy 0, policy_version 129120 (0.0004)
+[2023-03-09 16:30:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9677.7). Total num frames: 66121728. Throughput: 0: 9525.5. Samples: 66110916. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:13,996][744089] Avg episode reward: [(0, '445.293')]
+[2023-03-09 16:30:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000129144_66121728.pth...
+[2023-03-09 16:30:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000128584_65835008.pth
+[2023-03-09 16:30:16,856][744402] Updated weights for policy 0, policy_version 129200 (0.0005)
+[2023-03-09 16:30:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9677.7). Total num frames: 66166784. Throughput: 0: 9546.7. Samples: 66168092. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:18,995][744089] Avg episode reward: [(0, '495.264')]
+[2023-03-09 16:30:21,394][744402] Updated weights for policy 0, policy_version 129280 (0.0005)
+[2023-03-09 16:30:23,995][744089] Fps is (10 sec: 9011.4, 60 sec: 9420.8, 300 sec: 9649.9). Total num frames: 66211840. Throughput: 0: 9488.7. Samples: 66195472. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:23,995][744089] Avg episode reward: [(0, '372.713')]
+[2023-03-09 16:30:25,712][744402] Updated weights for policy 0, policy_version 129360 (0.0005)
+[2023-03-09 16:30:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9636.0). Total num frames: 66260992. Throughput: 0: 9465.8. Samples: 66252776. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:28,995][744089] Avg episode reward: [(0, '474.002')]
+[2023-03-09 16:30:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000129416_66260992.pth...
+[2023-03-09 16:30:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000128856_65974272.pth
+[2023-03-09 16:30:30,102][744402] Updated weights for policy 0, policy_version 129440 (0.0005)
+[2023-03-09 16:30:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9489.1, 300 sec: 9636.0). Total num frames: 66306048. Throughput: 0: 9383.5. Samples: 66306112. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:33,995][744089] Avg episode reward: [(0, '487.122')]
+[2023-03-09 16:30:34,616][744402] Updated weights for policy 0, policy_version 129520 (0.0005)
+[2023-03-09 16:30:38,926][744402] Updated weights for policy 0, policy_version 129600 (0.0005)
+[2023-03-09 16:30:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9636.0). Total num frames: 66355200. Throughput: 0: 9410.9. Samples: 66335140. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:38,995][744089] Avg episode reward: [(0, '497.478')]
+[2023-03-09 16:30:43,413][744402] Updated weights for policy 0, policy_version 129680 (0.0004)
+[2023-03-09 16:30:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9622.1). Total num frames: 66400256. Throughput: 0: 9411.7. Samples: 66391128. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:43,996][744089] Avg episode reward: [(0, '483.600')]
+[2023-03-09 16:30:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000129688_66400256.pth...
+[2023-03-09 16:30:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000129144_66121728.pth
+[2023-03-09 16:30:47,747][744402] Updated weights for policy 0, policy_version 129760 (0.0005)
+[2023-03-09 16:30:48,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9622.1). Total num frames: 66445312. Throughput: 0: 9355.2. Samples: 66446792. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:48,995][744089] Avg episode reward: [(0, '547.858')]
+[2023-03-09 16:30:52,285][744402] Updated weights for policy 0, policy_version 129840 (0.0005)
+[2023-03-09 16:30:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9622.1). Total num frames: 66494464. Throughput: 0: 9336.0. Samples: 66473996. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:30:53,995][744089] Avg episode reward: [(0, '545.132')]
+[2023-03-09 16:30:56,660][744402] Updated weights for policy 0, policy_version 129920 (0.0005)
+[2023-03-09 16:30:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9420.8, 300 sec: 9622.1). Total num frames: 66539520. Throughput: 0: 9304.2. Samples: 66529604. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:30:58,996][744089] Avg episode reward: [(0, '531.933')]
+[2023-03-09 16:30:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000129960_66539520.pth...
+[2023-03-09 16:30:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000129416_66260992.pth
+[2023-03-09 16:31:01,087][744402] Updated weights for policy 0, policy_version 130000 (0.0005)
+[2023-03-09 16:31:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9352.5, 300 sec: 9608.2). Total num frames: 66584576. Throughput: 0: 9281.8. Samples: 66585772. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:03,995][744089] Avg episode reward: [(0, '493.958')]
+[2023-03-09 16:31:05,407][744402] Updated weights for policy 0, policy_version 130080 (0.0004)
+[2023-03-09 16:31:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9352.5, 300 sec: 9608.2). Total num frames: 66633728. Throughput: 0: 9313.4. Samples: 66614576. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:08,995][744089] Avg episode reward: [(0, '457.237')]
+[2023-03-09 16:31:09,890][744402] Updated weights for policy 0, policy_version 130160 (0.0005)
+[2023-03-09 16:31:13,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9216.0, 300 sec: 9594.4). Total num frames: 66674688. Throughput: 0: 9218.8. Samples: 66667624. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:13,995][744089] Avg episode reward: [(0, '490.206')]
+[2023-03-09 16:31:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000130224_66674688.pth...
+[2023-03-09 16:31:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000129688_66400256.pth
+[2023-03-09 16:31:14,557][744402] Updated weights for policy 0, policy_version 130240 (0.0006)
+[2023-03-09 16:31:18,995][744089] Fps is (10 sec: 8601.7, 60 sec: 9216.0, 300 sec: 9566.6). Total num frames: 66719744. Throughput: 0: 9200.1. Samples: 66720116. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:18,995][744089] Avg episode reward: [(0, '465.037')]
+[2023-03-09 16:31:19,191][744402] Updated weights for policy 0, policy_version 130320 (0.0005)
+[2023-03-09 16:31:23,615][744402] Updated weights for policy 0, policy_version 130400 (0.0005)
+[2023-03-09 16:31:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 9552.7). Total num frames: 66764800. Throughput: 0: 9184.1. Samples: 66748424. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:23,996][744089] Avg episode reward: [(0, '532.441')]
+[2023-03-09 16:31:27,897][744402] Updated weights for policy 0, policy_version 130480 (0.0005)
+[2023-03-09 16:31:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9216.0, 300 sec: 9552.7). Total num frames: 66813952. Throughput: 0: 9208.7. Samples: 66805520. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:28,996][744089] Avg episode reward: [(0, '534.970')]
+[2023-03-09 16:31:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000130496_66813952.pth...
+[2023-03-09 16:31:29,004][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000129960_66539520.pth
+[2023-03-09 16:31:32,119][744402] Updated weights for policy 0, policy_version 130560 (0.0005)
+[2023-03-09 16:31:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9284.3, 300 sec: 9552.7). Total num frames: 66863104. Throughput: 0: 9251.5. Samples: 66863112. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:33,996][744089] Avg episode reward: [(0, '551.898')]
+[2023-03-09 16:31:36,484][744402] Updated weights for policy 0, policy_version 130640 (0.0005)
+[2023-03-09 16:31:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9538.8). Total num frames: 66908160. Throughput: 0: 9279.4. Samples: 66891568. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:38,995][744089] Avg episode reward: [(0, '591.780')]
+[2023-03-09 16:31:40,929][744402] Updated weights for policy 0, policy_version 130720 (0.0005)
+[2023-03-09 16:31:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9216.0, 300 sec: 9524.9). Total num frames: 66953216. Throughput: 0: 9242.5. Samples: 66945516. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:43,995][744089] Avg episode reward: [(0, '573.992')]
+[2023-03-09 16:31:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000130776_66957312.pth...
+[2023-03-09 16:31:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000130224_66674688.pth
+[2023-03-09 16:31:45,139][744402] Updated weights for policy 0, policy_version 130800 (0.0005)
+[2023-03-09 16:31:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9352.5, 300 sec: 9538.8). Total num frames: 67006464. Throughput: 0: 9346.3. Samples: 67006356. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:48,996][744089] Avg episode reward: [(0, '560.756')]
+[2023-03-09 16:31:49,363][744402] Updated weights for policy 0, policy_version 130880 (0.0005)
+[2023-03-09 16:31:53,475][744402] Updated weights for policy 0, policy_version 130960 (0.0005)
+[2023-03-09 16:31:53,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9352.5, 300 sec: 9552.7). Total num frames: 67055616. Throughput: 0: 9339.0. Samples: 67034832. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:31:53,995][744089] Avg episode reward: [(0, '514.902')]
+[2023-03-09 16:31:57,457][744402] Updated weights for policy 0, policy_version 131040 (0.0005)
+[2023-03-09 16:31:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9552.7). Total num frames: 67104768. Throughput: 0: 9528.0. Samples: 67096384. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:31:58,996][744089] Avg episode reward: [(0, '562.874')]
+[2023-03-09 16:31:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000131064_67104768.pth...
+[2023-03-09 16:31:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000130496_66813952.pth
+[2023-03-09 16:32:01,758][744402] Updated weights for policy 0, policy_version 131120 (0.0005)
+[2023-03-09 16:32:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.0, 300 sec: 9552.7). Total num frames: 67153920. Throughput: 0: 9625.0. Samples: 67153244. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:03,996][744089] Avg episode reward: [(0, '558.618')]
+[2023-03-09 16:32:05,980][744402] Updated weights for policy 0, policy_version 131200 (0.0005)
+[2023-03-09 16:32:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9538.8). Total num frames: 67203072. Throughput: 0: 9679.6. Samples: 67184004. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:08,995][744089] Avg episode reward: [(0, '550.598')]
+[2023-03-09 16:32:10,108][744402] Updated weights for policy 0, policy_version 131280 (0.0004)
+[2023-03-09 16:32:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9538.8). Total num frames: 67252224. Throughput: 0: 9682.7. Samples: 67241240. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:13,996][744089] Avg episode reward: [(0, '541.011')]
+[2023-03-09 16:32:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000131352_67252224.pth...
+[2023-03-09 16:32:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000130776_66957312.pth
+[2023-03-09 16:32:14,260][744402] Updated weights for policy 0, policy_version 131360 (0.0006)
+[2023-03-09 16:32:18,670][744402] Updated weights for policy 0, policy_version 131440 (0.0006)
+[2023-03-09 16:32:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9524.9). Total num frames: 67297280. Throughput: 0: 9681.4. Samples: 67298776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:18,995][744089] Avg episode reward: [(0, '488.492')]
+[2023-03-09 16:32:22,965][744402] Updated weights for policy 0, policy_version 131520 (0.0005)
+[2023-03-09 16:32:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9538.8). Total num frames: 67346432. Throughput: 0: 9654.4. Samples: 67326016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:23,995][744089] Avg episode reward: [(0, '502.880')]
+[2023-03-09 16:32:27,368][744402] Updated weights for policy 0, policy_version 131600 (0.0005)
+[2023-03-09 16:32:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9524.9). Total num frames: 67391488. Throughput: 0: 9728.4. Samples: 67383296. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:28,996][744089] Avg episode reward: [(0, '427.936')]
+[2023-03-09 16:32:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000131624_67391488.pth...
+[2023-03-09 16:32:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000131064_67104768.pth
+[2023-03-09 16:32:31,759][744402] Updated weights for policy 0, policy_version 131680 (0.0005)
+[2023-03-09 16:32:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9524.9). Total num frames: 67440640. Throughput: 0: 9625.8. Samples: 67439516. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:33,996][744089] Avg episode reward: [(0, '484.961')]
+[2023-03-09 16:32:36,097][744402] Updated weights for policy 0, policy_version 131760 (0.0005)
+[2023-03-09 16:32:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9524.9). Total num frames: 67485696. Throughput: 0: 9652.9. Samples: 67469212. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:38,995][744089] Avg episode reward: [(0, '509.694')]
+[2023-03-09 16:32:40,334][744402] Updated weights for policy 0, policy_version 131840 (0.0005)
+[2023-03-09 16:32:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9524.9). Total num frames: 67534848. Throughput: 0: 9563.0. Samples: 67526720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:43,995][744089] Avg episode reward: [(0, '519.629')]
+[2023-03-09 16:32:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000131904_67534848.pth...
+[2023-03-09 16:32:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000131352_67252224.pth
+[2023-03-09 16:32:44,490][744402] Updated weights for policy 0, policy_version 131920 (0.0005)
+[2023-03-09 16:32:48,607][744402] Updated weights for policy 0, policy_version 132000 (0.0005)
+[2023-03-09 16:32:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9524.9). Total num frames: 67584000. Throughput: 0: 9623.7. Samples: 67586308. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:48,995][744089] Avg episode reward: [(0, '535.088')]
+[2023-03-09 16:32:53,074][744402] Updated weights for policy 0, policy_version 132080 (0.0005)
+[2023-03-09 16:32:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9524.9). Total num frames: 67633152. Throughput: 0: 9535.7. Samples: 67613112. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:53,995][744089] Avg episode reward: [(0, '531.479')]
+[2023-03-09 16:32:57,353][744402] Updated weights for policy 0, policy_version 132160 (0.0005)
+[2023-03-09 16:32:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.4, 300 sec: 9524.9). Total num frames: 67678208. Throughput: 0: 9528.4. Samples: 67670016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:32:58,995][744089] Avg episode reward: [(0, '534.741')]
+[2023-03-09 16:32:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000132184_67678208.pth...
+[2023-03-09 16:32:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000131624_67391488.pth
+[2023-03-09 16:33:01,607][744402] Updated weights for policy 0, policy_version 132240 (0.0005)
+[2023-03-09 16:33:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9524.9). Total num frames: 67727360. Throughput: 0: 9561.4. Samples: 67729040. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:03,995][744089] Avg episode reward: [(0, '501.677')]
+[2023-03-09 16:33:05,629][744402] Updated weights for policy 0, policy_version 132320 (0.0005)
+[2023-03-09 16:33:08,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9625.6, 300 sec: 9538.8). Total num frames: 67780608. Throughput: 0: 9647.3. Samples: 67760144. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:08,995][744089] Avg episode reward: [(0, '527.839')]
+[2023-03-09 16:33:09,566][744402] Updated weights for policy 0, policy_version 132400 (0.0005)
+[2023-03-09 16:33:13,675][744402] Updated weights for policy 0, policy_version 132480 (0.0004)
+[2023-03-09 16:33:13,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9625.6, 300 sec: 9538.8). Total num frames: 67829760. Throughput: 0: 9731.0. Samples: 67821192. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:13,995][744089] Avg episode reward: [(0, '535.881')]
+[2023-03-09 16:33:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000132480_67829760.pth...
+[2023-03-09 16:33:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000131904_67534848.pth
+[2023-03-09 16:33:17,681][744402] Updated weights for policy 0, policy_version 132560 (0.0005)
+[2023-03-09 16:33:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9538.8). Total num frames: 67878912. Throughput: 0: 9801.6. Samples: 67880588. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:18,995][744089] Avg episode reward: [(0, '536.304')]
+[2023-03-09 16:33:22,036][744402] Updated weights for policy 0, policy_version 132640 (0.0005)
+[2023-03-09 16:33:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9552.7). Total num frames: 67928064. Throughput: 0: 9792.0. Samples: 67909852. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:23,995][744089] Avg episode reward: [(0, '487.010')]
+[2023-03-09 16:33:26,418][744402] Updated weights for policy 0, policy_version 132720 (0.0005)
+[2023-03-09 16:33:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9552.7). Total num frames: 67977216. Throughput: 0: 9775.9. Samples: 67966636. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:28,995][744089] Avg episode reward: [(0, '487.453')]
+[2023-03-09 16:33:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000132768_67977216.pth...
+[2023-03-09 16:33:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000132184_67678208.pth
+[2023-03-09 16:33:30,729][744402] Updated weights for policy 0, policy_version 132800 (0.0005)
+[2023-03-09 16:33:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9538.8). Total num frames: 68022272. Throughput: 0: 9742.1. Samples: 68024704. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:33,995][744089] Avg episode reward: [(0, '502.902')]
+[2023-03-09 16:33:34,915][744402] Updated weights for policy 0, policy_version 132880 (0.0004)
+[2023-03-09 16:33:38,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9762.1, 300 sec: 9552.7). Total num frames: 68071424. Throughput: 0: 9799.6. Samples: 68054092. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:38,995][744089] Avg episode reward: [(0, '493.259')]
+[2023-03-09 16:33:39,143][744402] Updated weights for policy 0, policy_version 132960 (0.0004)
+[2023-03-09 16:33:43,182][744402] Updated weights for policy 0, policy_version 133040 (0.0005)
+[2023-03-09 16:33:43,995][744089] Fps is (10 sec: 10239.8, 60 sec: 9830.4, 300 sec: 9566.6). Total num frames: 68124672. Throughput: 0: 9833.5. Samples: 68112524. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:43,996][744089] Avg episode reward: [(0, '524.711')]
+[2023-03-09 16:33:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000133056_68124672.pth...
+[2023-03-09 16:33:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000132480_67829760.pth
+[2023-03-09 16:33:47,729][744402] Updated weights for policy 0, policy_version 133120 (0.0004)
+[2023-03-09 16:33:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9552.7). Total num frames: 68165632. Throughput: 0: 9759.3. Samples: 68168208. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:48,995][744089] Avg episode reward: [(0, '525.009')]
+[2023-03-09 16:33:52,079][744402] Updated weights for policy 0, policy_version 133200 (0.0005)
+[2023-03-09 16:33:53,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9693.9, 300 sec: 9552.7). Total num frames: 68214784. Throughput: 0: 9693.3. Samples: 68196344. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:53,996][744089] Avg episode reward: [(0, '525.479')]
+[2023-03-09 16:33:56,267][744402] Updated weights for policy 0, policy_version 133280 (0.0005)
+[2023-03-09 16:33:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9552.7). Total num frames: 68263936. Throughput: 0: 9613.1. Samples: 68253780. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:33:58,996][744089] Avg episode reward: [(0, '550.974')]
+[2023-03-09 16:33:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000133328_68263936.pth...
+[2023-03-09 16:33:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000132768_67977216.pth
+[2023-03-09 16:34:00,559][744402] Updated weights for policy 0, policy_version 133360 (0.0005)
+[2023-03-09 16:34:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9552.7). Total num frames: 68313088. Throughput: 0: 9604.4. Samples: 68312788. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:03,996][744089] Avg episode reward: [(0, '537.149')]
+[2023-03-09 16:34:04,868][744402] Updated weights for policy 0, policy_version 133440 (0.0005)
+[2023-03-09 16:34:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9524.9). Total num frames: 68358144. Throughput: 0: 9556.4. Samples: 68339892. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:08,995][744089] Avg episode reward: [(0, '550.345')]
+[2023-03-09 16:34:09,283][744402] Updated weights for policy 0, policy_version 133520 (0.0005)
+[2023-03-09 16:34:13,368][744402] Updated weights for policy 0, policy_version 133600 (0.0004)
+[2023-03-09 16:34:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9538.8). Total num frames: 68407296. Throughput: 0: 9585.4. Samples: 68397980. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:13,996][744089] Avg episode reward: [(0, '550.921')]
+[2023-03-09 16:34:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000133608_68407296.pth...
+[2023-03-09 16:34:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000133056_68124672.pth
+[2023-03-09 16:34:17,755][744402] Updated weights for policy 0, policy_version 133680 (0.0004)
+[2023-03-09 16:34:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9511.1). Total num frames: 68452352. Throughput: 0: 9553.5. Samples: 68454612. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:18,995][744089] Avg episode reward: [(0, '572.600')]
+[2023-03-09 16:34:21,871][744402] Updated weights for policy 0, policy_version 133760 (0.0004)
+[2023-03-09 16:34:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9538.8). Total num frames: 68505600. Throughput: 0: 9578.3. Samples: 68485116. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:23,995][744089] Avg episode reward: [(0, '572.596')]
+[2023-03-09 16:34:25,874][744402] Updated weights for policy 0, policy_version 133840 (0.0005)
+[2023-03-09 16:34:28,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 68554752. Throughput: 0: 9640.0. Samples: 68546324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:28,995][744089] Avg episode reward: [(0, '567.682')]
+[2023-03-09 16:34:28,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000133896_68554752.pth...
+[2023-03-09 16:34:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000133328_68263936.pth
+[2023-03-09 16:34:30,050][744402] Updated weights for policy 0, policy_version 133920 (0.0004)
+[2023-03-09 16:34:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9538.8). Total num frames: 68603904. Throughput: 0: 9683.5. Samples: 68603968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:33,995][744089] Avg episode reward: [(0, '546.736')]
+[2023-03-09 16:34:34,157][744402] Updated weights for policy 0, policy_version 134000 (0.0005)
+[2023-03-09 16:34:38,430][744402] Updated weights for policy 0, policy_version 134080 (0.0005)
+[2023-03-09 16:34:38,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.8, 300 sec: 9552.7). Total num frames: 68653056. Throughput: 0: 9700.9. Samples: 68632884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:38,996][744089] Avg episode reward: [(0, '549.410')]
+[2023-03-09 16:34:42,832][744402] Updated weights for policy 0, policy_version 134160 (0.0006)
+[2023-03-09 16:34:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.4, 300 sec: 9538.8). Total num frames: 68698112. Throughput: 0: 9692.0. Samples: 68689920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:43,995][744089] Avg episode reward: [(0, '553.729')]
+[2023-03-09 16:34:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000134176_68698112.pth...
+[2023-03-09 16:34:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000133608_68407296.pth
+[2023-03-09 16:34:47,047][744402] Updated weights for policy 0, policy_version 134240 (0.0005)
+[2023-03-09 16:34:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9552.7). Total num frames: 68747264. Throughput: 0: 9656.7. Samples: 68747336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:48,995][744089] Avg episode reward: [(0, '529.984')]
+[2023-03-09 16:34:51,226][744402] Updated weights for policy 0, policy_version 134320 (0.0006)
+[2023-03-09 16:34:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9566.6). Total num frames: 68796416. Throughput: 0: 9731.4. Samples: 68777804. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:53,995][744089] Avg episode reward: [(0, '544.905')]
+[2023-03-09 16:34:55,644][744402] Updated weights for policy 0, policy_version 134400 (0.0005)
+[2023-03-09 16:34:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 68841472. Throughput: 0: 9673.2. Samples: 68833272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:34:58,996][744089] Avg episode reward: [(0, '561.709')]
+[2023-03-09 16:34:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000134456_68841472.pth...
+[2023-03-09 16:34:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000133896_68554752.pth
+[2023-03-09 16:34:59,847][744402] Updated weights for policy 0, policy_version 134480 (0.0005)
+[2023-03-09 16:35:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 68890624. Throughput: 0: 9737.4. Samples: 68892796. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:35:03,995][744089] Avg episode reward: [(0, '553.571')]
+[2023-03-09 16:35:04,057][744402] Updated weights for policy 0, policy_version 134560 (0.0005)
+[2023-03-09 16:35:08,287][744402] Updated weights for policy 0, policy_version 134640 (0.0005)
+[2023-03-09 16:35:08,995][744089] Fps is (10 sec: 9830.6, 60 sec: 9693.9, 300 sec: 9552.7). Total num frames: 68939776. Throughput: 0: 9680.0. Samples: 68920716. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:08,995][744089] Avg episode reward: [(0, '563.494')]
+[2023-03-09 16:35:12,550][744402] Updated weights for policy 0, policy_version 134720 (0.0005)
+[2023-03-09 16:35:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9566.6). Total num frames: 68988928. Throughput: 0: 9631.5. Samples: 68979744. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:13,996][744089] Avg episode reward: [(0, '550.025')]
+[2023-03-09 16:35:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000134744_68988928.pth...
+[2023-03-09 16:35:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000134176_68698112.pth
+[2023-03-09 16:35:16,726][744402] Updated weights for policy 0, policy_version 134800 (0.0005)
+[2023-03-09 16:35:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9580.5). Total num frames: 69038080. Throughput: 0: 9646.9. Samples: 69038080. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:18,995][744089] Avg episode reward: [(0, '576.956')]
+[2023-03-09 16:35:21,107][744402] Updated weights for policy 0, policy_version 134880 (0.0005)
+[2023-03-09 16:35:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9566.6). Total num frames: 69083136. Throughput: 0: 9626.0. Samples: 69066056. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:23,995][744089] Avg episode reward: [(0, '562.781')]
+[2023-03-09 16:35:25,374][744402] Updated weights for policy 0, policy_version 134960 (0.0005)
+[2023-03-09 16:35:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9580.5). Total num frames: 69132288. Throughput: 0: 9616.3. Samples: 69122652. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:28,995][744089] Avg episode reward: [(0, '561.723')]
+[2023-03-09 16:35:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000135024_69132288.pth...
+[2023-03-09 16:35:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000134456_68841472.pth
+[2023-03-09 16:35:29,618][744402] Updated weights for policy 0, policy_version 135040 (0.0005)
+[2023-03-09 16:35:33,948][744402] Updated weights for policy 0, policy_version 135120 (0.0005)
+[2023-03-09 16:35:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9580.5). Total num frames: 69181440. Throughput: 0: 9628.2. Samples: 69180608. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:33,995][744089] Avg episode reward: [(0, '552.775')]
+[2023-03-09 16:35:38,409][744402] Updated weights for policy 0, policy_version 135200 (0.0004)
+[2023-03-09 16:35:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9580.5). Total num frames: 69226496. Throughput: 0: 9554.2. Samples: 69207744. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:38,996][744089] Avg episode reward: [(0, '573.959')]
+[2023-03-09 16:35:42,746][744402] Updated weights for policy 0, policy_version 135280 (0.0005)
+[2023-03-09 16:35:43,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9557.3, 300 sec: 9580.5). Total num frames: 69271552. Throughput: 0: 9563.9. Samples: 69263648. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:43,995][744089] Avg episode reward: [(0, '548.353')]
+[2023-03-09 16:35:44,031][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000135304_69275648.pth...
+[2023-03-09 16:35:44,033][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000134744_68988928.pth
+[2023-03-09 16:35:47,030][744402] Updated weights for policy 0, policy_version 135360 (0.0005)
+[2023-03-09 16:35:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9580.5). Total num frames: 69320704. Throughput: 0: 9526.1. Samples: 69321472. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:48,996][744089] Avg episode reward: [(0, '582.134')]
+[2023-03-09 16:35:51,231][744402] Updated weights for policy 0, policy_version 135440 (0.0005)
+[2023-03-09 16:35:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9557.4, 300 sec: 9594.4). Total num frames: 69369856. Throughput: 0: 9565.8. Samples: 69351176. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:53,995][744089] Avg episode reward: [(0, '604.065')]
+[2023-03-09 16:35:53,996][744358] Saving new best policy, reward=604.065!
+[2023-03-09 16:35:55,493][744402] Updated weights for policy 0, policy_version 135520 (0.0005)
+[2023-03-09 16:35:58,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9608.2). Total num frames: 69419008. Throughput: 0: 9578.7. Samples: 69410784. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:35:58,995][744089] Avg episode reward: [(0, '592.093')]
+[2023-03-09 16:35:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000135584_69419008.pth...
+[2023-03-09 16:35:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000135024_69132288.pth
+[2023-03-09 16:35:59,462][744402] Updated weights for policy 0, policy_version 135600 (0.0005)
+[2023-03-09 16:36:03,546][744402] Updated weights for policy 0, policy_version 135680 (0.0005)
+[2023-03-09 16:36:03,995][744089] Fps is (10 sec: 10239.8, 60 sec: 9693.8, 300 sec: 9622.1). Total num frames: 69472256. Throughput: 0: 9634.6. Samples: 69471636. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:36:03,996][744089] Avg episode reward: [(0, '589.097')]
+[2023-03-09 16:36:07,887][744402] Updated weights for policy 0, policy_version 135760 (0.0005)
+[2023-03-09 16:36:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 69517312. Throughput: 0: 9638.0. Samples: 69499768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:08,995][744089] Avg episode reward: [(0, '586.155')]
+[2023-03-09 16:36:12,033][744402] Updated weights for policy 0, policy_version 135840 (0.0005)
+[2023-03-09 16:36:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 69566464. Throughput: 0: 9679.0. Samples: 69558208. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:13,996][744089] Avg episode reward: [(0, '556.274')]
+[2023-03-09 16:36:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000135872_69566464.pth...
+[2023-03-09 16:36:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000135304_69275648.pth
+[2023-03-09 16:36:16,285][744402] Updated weights for policy 0, policy_version 135920 (0.0005)
+[2023-03-09 16:36:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 69615616. Throughput: 0: 9675.1. Samples: 69615988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:18,995][744089] Avg episode reward: [(0, '508.768')]
+[2023-03-09 16:36:20,349][744402] Updated weights for policy 0, policy_version 136000 (0.0005)
+[2023-03-09 16:36:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 69664768. Throughput: 0: 9725.8. Samples: 69645404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:23,995][744089] Avg episode reward: [(0, '516.440')]
+[2023-03-09 16:36:24,737][744402] Updated weights for policy 0, policy_version 136080 (0.0005)
+[2023-03-09 16:36:28,879][744402] Updated weights for policy 0, policy_version 136160 (0.0005)
+[2023-03-09 16:36:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 69713920. Throughput: 0: 9775.5. Samples: 69703548. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:28,996][744089] Avg episode reward: [(0, '538.622')]
+[2023-03-09 16:36:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000136160_69713920.pth...
+[2023-03-09 16:36:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000135584_69419008.pth
+[2023-03-09 16:36:33,270][744402] Updated weights for policy 0, policy_version 136240 (0.0004)
+[2023-03-09 16:36:33,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 69758976. Throughput: 0: 9724.3. Samples: 69759064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:33,995][744089] Avg episode reward: [(0, '528.211')]
+[2023-03-09 16:36:37,468][744402] Updated weights for policy 0, policy_version 136320 (0.0005)
+[2023-03-09 16:36:38,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 69808128. Throughput: 0: 9735.9. Samples: 69789292. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:38,995][744089] Avg episode reward: [(0, '493.457')]
+[2023-03-09 16:36:41,867][744402] Updated weights for policy 0, policy_version 136400 (0.0005)
+[2023-03-09 16:36:43,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.2, 300 sec: 9663.8). Total num frames: 69857280. Throughput: 0: 9661.2. Samples: 69845536. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:43,995][744089] Avg episode reward: [(0, '501.689')]
+[2023-03-09 16:36:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000136440_69857280.pth...
+[2023-03-09 16:36:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000135872_69566464.pth
+[2023-03-09 16:36:45,754][744402] Updated weights for policy 0, policy_version 136480 (0.0004)
+[2023-03-09 16:36:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 69906432. Throughput: 0: 9653.2. Samples: 69906028. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:48,996][744089] Avg episode reward: [(0, '506.184')]
+[2023-03-09 16:36:50,198][744402] Updated weights for policy 0, policy_version 136560 (0.0006)
+[2023-03-09 16:36:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9649.9). Total num frames: 69951488. Throughput: 0: 9650.3. Samples: 69934032. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:53,995][744089] Avg episode reward: [(0, '518.432')]
+[2023-03-09 16:36:54,435][744402] Updated weights for policy 0, policy_version 136640 (0.0005)
+[2023-03-09 16:36:58,778][744402] Updated weights for policy 0, policy_version 136720 (0.0005)
+[2023-03-09 16:36:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9649.9). Total num frames: 70000640. Throughput: 0: 9644.7. Samples: 69992220. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:36:58,996][744089] Avg episode reward: [(0, '509.515')]
+[2023-03-09 16:36:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000136720_70000640.pth...
+[2023-03-09 16:36:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000136160_69713920.pth
+[2023-03-09 16:37:02,766][744402] Updated weights for policy 0, policy_version 136800 (0.0005)
+[2023-03-09 16:37:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 70049792. Throughput: 0: 9691.0. Samples: 70052084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:03,995][744089] Avg episode reward: [(0, '535.015')]
+[2023-03-09 16:37:06,840][744402] Updated weights for policy 0, policy_version 136880 (0.0005)
+[2023-03-09 16:37:08,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 70103040. Throughput: 0: 9714.7. Samples: 70082568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:08,996][744089] Avg episode reward: [(0, '545.169')]
+[2023-03-09 16:37:11,113][744402] Updated weights for policy 0, policy_version 136960 (0.0005)
+[2023-03-09 16:37:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 70148096. Throughput: 0: 9696.8. Samples: 70139904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:13,996][744089] Avg episode reward: [(0, '553.881')]
+[2023-03-09 16:37:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000137008_70148096.pth...
+[2023-03-09 16:37:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000136440_69857280.pth
+[2023-03-09 16:37:15,571][744402] Updated weights for policy 0, policy_version 137040 (0.0005)
+[2023-03-09 16:37:18,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 70193152. Throughput: 0: 9699.7. Samples: 70195552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:18,995][744089] Avg episode reward: [(0, '563.165')]
+[2023-03-09 16:37:19,847][744402] Updated weights for policy 0, policy_version 137120 (0.0005)
+[2023-03-09 16:37:23,786][744402] Updated weights for policy 0, policy_version 137200 (0.0005)
+[2023-03-09 16:37:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 70246400. Throughput: 0: 9704.5. Samples: 70225996. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:23,995][744089] Avg episode reward: [(0, '559.223')]
+[2023-03-09 16:37:28,107][744402] Updated weights for policy 0, policy_version 137280 (0.0005)
+[2023-03-09 16:37:28,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 70295552. Throughput: 0: 9738.2. Samples: 70283756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:29,006][744089] Avg episode reward: [(0, '547.887')]
+[2023-03-09 16:37:29,010][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000137296_70295552.pth...
+[2023-03-09 16:37:29,013][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000136720_70000640.pth
+[2023-03-09 16:37:32,273][744402] Updated weights for policy 0, policy_version 137360 (0.0004)
+[2023-03-09 16:37:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 70344704. Throughput: 0: 9718.3. Samples: 70343352. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:33,996][744089] Avg episode reward: [(0, '552.315')]
+[2023-03-09 16:37:36,536][744402] Updated weights for policy 0, policy_version 137440 (0.0005)
+[2023-03-09 16:37:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 70389760. Throughput: 0: 9748.3. Samples: 70372708. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:38,995][744089] Avg episode reward: [(0, '557.516')]
+[2023-03-09 16:37:40,816][744402] Updated weights for policy 0, policy_version 137520 (0.0005)
+[2023-03-09 16:37:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.8, 300 sec: 9677.7). Total num frames: 70438912. Throughput: 0: 9709.1. Samples: 70429128. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:43,996][744089] Avg episode reward: [(0, '534.468')]
+[2023-03-09 16:37:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000137576_70438912.pth...
+[2023-03-09 16:37:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000137008_70148096.pth
+[2023-03-09 16:37:45,224][744402] Updated weights for policy 0, policy_version 137600 (0.0005)
+[2023-03-09 16:37:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 70483968. Throughput: 0: 9629.5. Samples: 70485412. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:48,995][744089] Avg episode reward: [(0, '541.212')]
+[2023-03-09 16:37:49,562][744402] Updated weights for policy 0, policy_version 137680 (0.0004)
+[2023-03-09 16:37:53,745][744402] Updated weights for policy 0, policy_version 137760 (0.0005)
+[2023-03-09 16:37:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 70533120. Throughput: 0: 9569.4. Samples: 70513192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:53,995][744089] Avg episode reward: [(0, '543.420')]
+[2023-03-09 16:37:57,675][744402] Updated weights for policy 0, policy_version 137840 (0.0005)
+[2023-03-09 16:37:58,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 70586368. Throughput: 0: 9680.1. Samples: 70575508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:37:58,995][744089] Avg episode reward: [(0, '556.660')]
+[2023-03-09 16:37:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000137864_70586368.pth...
+[2023-03-09 16:37:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000137296_70295552.pth
+[2023-03-09 16:38:02,040][744402] Updated weights for policy 0, policy_version 137920 (0.0005)
+[2023-03-09 16:38:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.8, 300 sec: 9663.8). Total num frames: 70631424. Throughput: 0: 9692.3. Samples: 70631704. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:03,996][744089] Avg episode reward: [(0, '551.007')]
+[2023-03-09 16:38:06,279][744402] Updated weights for policy 0, policy_version 138000 (0.0005)
+[2023-03-09 16:38:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 70680576. Throughput: 0: 9693.5. Samples: 70662204. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:08,995][744089] Avg episode reward: [(0, '532.782')]
+[2023-03-09 16:38:10,470][744402] Updated weights for policy 0, policy_version 138080 (0.0005)
+[2023-03-09 16:38:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 70729728. Throughput: 0: 9698.6. Samples: 70720196. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:13,996][744089] Avg episode reward: [(0, '533.924')]
+[2023-03-09 16:38:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000138144_70729728.pth...
+[2023-03-09 16:38:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000137576_70438912.pth
+[2023-03-09 16:38:14,704][744402] Updated weights for policy 0, policy_version 138160 (0.0005)
+[2023-03-09 16:38:18,847][744402] Updated weights for policy 0, policy_version 138240 (0.0005)
+[2023-03-09 16:38:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 70778880. Throughput: 0: 9678.4. Samples: 70778880. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:18,996][744089] Avg episode reward: [(0, '539.657')]
+[2023-03-09 16:38:23,445][744402] Updated weights for policy 0, policy_version 138320 (0.0005)
+[2023-03-09 16:38:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 70823936. Throughput: 0: 9616.3. Samples: 70805444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:23,995][744089] Avg episode reward: [(0, '562.849')]
+[2023-03-09 16:38:27,710][744402] Updated weights for policy 0, policy_version 138400 (0.0005)
+[2023-03-09 16:38:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 70873088. Throughput: 0: 9612.0. Samples: 70861668. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:28,996][744089] Avg episode reward: [(0, '552.757')]
+[2023-03-09 16:38:29,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000138424_70873088.pth...
+[2023-03-09 16:38:29,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000137864_70586368.pth
+[2023-03-09 16:38:31,901][744402] Updated weights for policy 0, policy_version 138480 (0.0005)
+[2023-03-09 16:38:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 70918144. Throughput: 0: 9619.8. Samples: 70918304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:33,995][744089] Avg episode reward: [(0, '550.580')]
+[2023-03-09 16:38:36,343][744402] Updated weights for policy 0, policy_version 138560 (0.0005)
+[2023-03-09 16:38:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 70967296. Throughput: 0: 9637.7. Samples: 70946888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:38,995][744089] Avg episode reward: [(0, '547.778')]
+[2023-03-09 16:38:40,655][744402] Updated weights for policy 0, policy_version 138640 (0.0004)
+[2023-03-09 16:38:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 71012352. Throughput: 0: 9547.7. Samples: 71005156. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:43,996][744089] Avg episode reward: [(0, '540.867')]
+[2023-03-09 16:38:44,004][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000138704_71016448.pth...
+[2023-03-09 16:38:44,005][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000138144_70729728.pth
+[2023-03-09 16:38:44,904][744402] Updated weights for policy 0, policy_version 138720 (0.0004)
+[2023-03-09 16:38:48,932][744402] Updated weights for policy 0, policy_version 138800 (0.0004)
+[2023-03-09 16:38:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 71065600. Throughput: 0: 9626.9. Samples: 71064912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:48,995][744089] Avg episode reward: [(0, '550.019')]
+[2023-03-09 16:38:53,097][744402] Updated weights for policy 0, policy_version 138880 (0.0005)
+[2023-03-09 16:38:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 71110656. Throughput: 0: 9599.7. Samples: 71094192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:53,995][744089] Avg episode reward: [(0, '530.421')]
+[2023-03-09 16:38:57,463][744402] Updated weights for policy 0, policy_version 138960 (0.0005)
+[2023-03-09 16:38:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 71159808. Throughput: 0: 9586.1. Samples: 71151568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:38:58,996][744089] Avg episode reward: [(0, '522.490')]
+[2023-03-09 16:38:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000138984_71159808.pth...
+[2023-03-09 16:38:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000138424_70873088.pth
+[2023-03-09 16:39:01,770][744402] Updated weights for policy 0, policy_version 139040 (0.0006)
+[2023-03-09 16:39:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 71208960. Throughput: 0: 9557.3. Samples: 71208960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:39:03,996][744089] Avg episode reward: [(0, '551.685')]
+[2023-03-09 16:39:06,080][744402] Updated weights for policy 0, policy_version 139120 (0.0005)
+[2023-03-09 16:39:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 71254016. Throughput: 0: 9588.4. Samples: 71236920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:39:08,995][744089] Avg episode reward: [(0, '526.388')]
+[2023-03-09 16:39:10,399][744402] Updated weights for policy 0, policy_version 139200 (0.0005)
+[2023-03-09 16:39:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 71303168. Throughput: 0: 9587.9. Samples: 71293124. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:39:13,995][744089] Avg episode reward: [(0, '516.384')]
+[2023-03-09 16:39:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000139264_71303168.pth...
+[2023-03-09 16:39:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000138704_71016448.pth
+[2023-03-09 16:39:14,615][744402] Updated weights for policy 0, policy_version 139280 (0.0005)
+[2023-03-09 16:39:18,942][744402] Updated weights for policy 0, policy_version 139360 (0.0005)
+[2023-03-09 16:39:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 71352320. Throughput: 0: 9627.0. Samples: 71351520. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:18,996][744089] Avg episode reward: [(0, '503.494')]
+[2023-03-09 16:39:23,152][744402] Updated weights for policy 0, policy_version 139440 (0.0005)
+[2023-03-09 16:39:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 71401472. Throughput: 0: 9641.0. Samples: 71380732. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:23,995][744089] Avg episode reward: [(0, '494.182')]
+[2023-03-09 16:39:27,419][744402] Updated weights for policy 0, policy_version 139520 (0.0005)
+[2023-03-09 16:39:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9636.0). Total num frames: 71446528. Throughput: 0: 9622.9. Samples: 71438188. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:28,996][744089] Avg episode reward: [(0, '508.702')]
+[2023-03-09 16:39:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000139544_71446528.pth...
+[2023-03-09 16:39:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000138984_71159808.pth
+[2023-03-09 16:39:31,631][744402] Updated weights for policy 0, policy_version 139600 (0.0005)
+[2023-03-09 16:39:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 71495680. Throughput: 0: 9572.5. Samples: 71495676. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:33,995][744089] Avg episode reward: [(0, '510.318')]
+[2023-03-09 16:39:36,078][744402] Updated weights for policy 0, policy_version 139680 (0.0005)
+[2023-03-09 16:39:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9636.0). Total num frames: 71540736. Throughput: 0: 9556.9. Samples: 71524252. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:38,996][744089] Avg episode reward: [(0, '506.414')]
+[2023-03-09 16:39:40,387][744402] Updated weights for policy 0, policy_version 139760 (0.0005)
+[2023-03-09 16:39:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 71589888. Throughput: 0: 9510.8. Samples: 71579556. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:43,996][744089] Avg episode reward: [(0, '479.351')]
+[2023-03-09 16:39:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000139824_71589888.pth...
+[2023-03-09 16:39:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000139264_71303168.pth
+[2023-03-09 16:39:44,805][744402] Updated weights for policy 0, policy_version 139840 (0.0005)
+[2023-03-09 16:39:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9622.1). Total num frames: 71634944. Throughput: 0: 9476.1. Samples: 71635384. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:48,995][744089] Avg episode reward: [(0, '467.916')]
+[2023-03-09 16:39:49,186][744402] Updated weights for policy 0, policy_version 139920 (0.0005)
+[2023-03-09 16:39:53,240][744402] Updated weights for policy 0, policy_version 140000 (0.0005)
+[2023-03-09 16:39:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 71688192. Throughput: 0: 9517.8. Samples: 71665220. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:53,995][744089] Avg episode reward: [(0, '436.145')]
+[2023-03-09 16:39:57,392][744402] Updated weights for policy 0, policy_version 140080 (0.0005)
+[2023-03-09 16:39:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9636.0). Total num frames: 71733248. Throughput: 0: 9597.9. Samples: 71725028. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:39:58,996][744089] Avg episode reward: [(0, '493.400')]
+[2023-03-09 16:39:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000140104_71733248.pth...
+[2023-03-09 16:39:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000139544_71446528.pth
+[2023-03-09 16:40:01,467][744402] Updated weights for policy 0, policy_version 140160 (0.0004)
+[2023-03-09 16:40:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 71786496. Throughput: 0: 9664.8. Samples: 71786436. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:40:03,995][744089] Avg episode reward: [(0, '505.295')]
+[2023-03-09 16:40:05,510][744402] Updated weights for policy 0, policy_version 140240 (0.0005)
+[2023-03-09 16:40:08,995][744089] Fps is (10 sec: 10240.2, 60 sec: 9693.9, 300 sec: 9649.9). Total num frames: 71835648. Throughput: 0: 9648.6. Samples: 71814916. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:40:08,995][744089] Avg episode reward: [(0, '479.566')]
+[2023-03-09 16:40:09,812][744402] Updated weights for policy 0, policy_version 140320 (0.0005)
+[2023-03-09 16:40:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 71880704. Throughput: 0: 9653.1. Samples: 71872576. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 16:40:13,995][744089] Avg episode reward: [(0, '470.329')]
+[2023-03-09 16:40:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000140392_71880704.pth...
+[2023-03-09 16:40:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000139824_71589888.pth
+[2023-03-09 16:40:14,081][744402] Updated weights for policy 0, policy_version 140400 (0.0005)
+[2023-03-09 16:40:18,330][744402] Updated weights for policy 0, policy_version 140480 (0.0005)
+[2023-03-09 16:40:18,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 71929856. Throughput: 0: 9658.8. Samples: 71930320. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:18,995][744089] Avg episode reward: [(0, '474.203')]
+[2023-03-09 16:40:22,534][744402] Updated weights for policy 0, policy_version 140560 (0.0005)
+[2023-03-09 16:40:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 71979008. Throughput: 0: 9677.4. Samples: 71959732. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:23,995][744089] Avg episode reward: [(0, '451.090')]
+[2023-03-09 16:40:26,700][744402] Updated weights for policy 0, policy_version 140640 (0.0006)
+[2023-03-09 16:40:28,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9649.9). Total num frames: 72028160. Throughput: 0: 9788.4. Samples: 72020032. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:28,995][744089] Avg episode reward: [(0, '455.710')]
+[2023-03-09 16:40:29,024][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000140688_72032256.pth...
+[2023-03-09 16:40:29,026][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000140104_71733248.pth
+[2023-03-09 16:40:30,689][744402] Updated weights for policy 0, policy_version 140720 (0.0005)
+[2023-03-09 16:40:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 72077312. Throughput: 0: 9832.4. Samples: 72077840. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:33,995][744089] Avg episode reward: [(0, '480.450')]
+[2023-03-09 16:40:35,018][744402] Updated weights for policy 0, policy_version 140800 (0.0005)
+[2023-03-09 16:40:38,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9677.7). Total num frames: 72126464. Throughput: 0: 9793.9. Samples: 72105944. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:38,995][744089] Avg episode reward: [(0, '483.551')]
+[2023-03-09 16:40:39,165][744402] Updated weights for policy 0, policy_version 140880 (0.0005)
+[2023-03-09 16:40:43,631][744402] Updated weights for policy 0, policy_version 140960 (0.0006)
+[2023-03-09 16:40:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 72171520. Throughput: 0: 9750.3. Samples: 72163788. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:43,995][744089] Avg episode reward: [(0, '472.884')]
+[2023-03-09 16:40:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000140960_72171520.pth...
+[2023-03-09 16:40:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000140392_71880704.pth
+[2023-03-09 16:40:47,766][744402] Updated weights for policy 0, policy_version 141040 (0.0005)
+[2023-03-09 16:40:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9677.7). Total num frames: 72224768. Throughput: 0: 9721.2. Samples: 72223888. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:48,996][744089] Avg episode reward: [(0, '494.482')]
+[2023-03-09 16:40:51,941][744402] Updated weights for policy 0, policy_version 141120 (0.0005)
+[2023-03-09 16:40:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 72269824. Throughput: 0: 9738.9. Samples: 72253168. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:53,995][744089] Avg episode reward: [(0, '497.519')]
+[2023-03-09 16:40:56,228][744402] Updated weights for policy 0, policy_version 141200 (0.0005)
+[2023-03-09 16:40:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9649.9). Total num frames: 72318976. Throughput: 0: 9692.7. Samples: 72308748. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:40:58,996][744089] Avg episode reward: [(0, '478.563')]
+[2023-03-09 16:40:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000141248_72318976.pth...
+[2023-03-09 16:40:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000140688_72032256.pth
+[2023-03-09 16:41:00,358][744402] Updated weights for policy 0, policy_version 141280 (0.0005)
+[2023-03-09 16:41:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 72368128. Throughput: 0: 9717.7. Samples: 72367616. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:41:03,996][744089] Avg episode reward: [(0, '511.164')]
+[2023-03-09 16:41:04,792][744402] Updated weights for policy 0, policy_version 141360 (0.0005)
+[2023-03-09 16:41:08,945][744402] Updated weights for policy 0, policy_version 141440 (0.0005)
+[2023-03-09 16:41:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 72417280. Throughput: 0: 9685.4. Samples: 72395576. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:41:08,995][744089] Avg episode reward: [(0, '525.293')]
+[2023-03-09 16:41:12,845][744402] Updated weights for policy 0, policy_version 141520 (0.0005)
+[2023-03-09 16:41:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 72466432. Throughput: 0: 9737.0. Samples: 72458200. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:41:13,995][744089] Avg episode reward: [(0, '519.846')]
+[2023-03-09 16:41:14,045][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000141544_72470528.pth...
+[2023-03-09 16:41:14,047][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000140960_72171520.pth
+[2023-03-09 16:41:17,029][744402] Updated weights for policy 0, policy_version 141600 (0.0004)
+[2023-03-09 16:41:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 72515584. Throughput: 0: 9748.5. Samples: 72516524. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:41:18,995][744089] Avg episode reward: [(0, '501.149')]
+[2023-03-09 16:41:21,143][744402] Updated weights for policy 0, policy_version 141680 (0.0005)
+[2023-03-09 16:41:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 72564736. Throughput: 0: 9789.6. Samples: 72546476. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:41:23,996][744089] Avg episode reward: [(0, '501.937')]
+[2023-03-09 16:41:25,590][744402] Updated weights for policy 0, policy_version 141760 (0.0005)
+[2023-03-09 16:41:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.8, 300 sec: 9663.8). Total num frames: 72609792. Throughput: 0: 9744.3. Samples: 72602284. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:41:28,995][744089] Avg episode reward: [(0, '492.056')]
+[2023-03-09 16:41:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000141816_72609792.pth...
+[2023-03-09 16:41:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000141248_72318976.pth
+[2023-03-09 16:41:29,940][744402] Updated weights for policy 0, policy_version 141840 (0.0004)
+[2023-03-09 16:41:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 72658944. Throughput: 0: 9666.8. Samples: 72658896. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:41:33,996][744089] Avg episode reward: [(0, '479.356')]
+[2023-03-09 16:41:34,327][744402] Updated weights for policy 0, policy_version 141920 (0.0005)
+[2023-03-09 16:41:38,529][744402] Updated weights for policy 0, policy_version 142000 (0.0005)
+[2023-03-09 16:41:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9663.8). Total num frames: 72708096. Throughput: 0: 9654.2. Samples: 72687608. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:41:38,996][744089] Avg episode reward: [(0, '514.011')]
+[2023-03-09 16:41:42,487][744402] Updated weights for policy 0, policy_version 142080 (0.0005)
+[2023-03-09 16:41:43,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9677.7). Total num frames: 72761344. Throughput: 0: 9783.2. Samples: 72748992. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:41:43,996][744089] Avg episode reward: [(0, '522.456')]
+[2023-03-09 16:41:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000142112_72761344.pth...
+[2023-03-09 16:41:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000141544_72470528.pth
+[2023-03-09 16:41:46,501][744402] Updated weights for policy 0, policy_version 142160 (0.0005)
+[2023-03-09 16:41:48,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9691.5). Total num frames: 72810496. Throughput: 0: 9835.5. Samples: 72810212. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:41:48,995][744089] Avg episode reward: [(0, '524.447')]
+[2023-03-09 16:41:50,666][744402] Updated weights for policy 0, policy_version 142240 (0.0005)
+[2023-03-09 16:41:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 72859648. Throughput: 0: 9844.2. Samples: 72838564. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:41:53,995][744089] Avg episode reward: [(0, '528.417')]
+[2023-03-09 16:41:54,706][744402] Updated weights for policy 0, policy_version 142320 (0.0005)
+[2023-03-09 16:41:58,931][744402] Updated weights for policy 0, policy_version 142400 (0.0005)
+[2023-03-09 16:41:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9691.5). Total num frames: 72908800. Throughput: 0: 9759.8. Samples: 72897392. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:41:58,996][744089] Avg episode reward: [(0, '530.562')]
+[2023-03-09 16:41:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000142400_72908800.pth...
+[2023-03-09 16:41:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000141816_72609792.pth
+[2023-03-09 16:42:03,300][744402] Updated weights for policy 0, policy_version 142480 (0.0005)
+[2023-03-09 16:42:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 72953856. Throughput: 0: 9739.8. Samples: 72954816. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:42:03,995][744089] Avg episode reward: [(0, '470.319')]
+[2023-03-09 16:42:07,521][744402] Updated weights for policy 0, policy_version 142560 (0.0005)
+[2023-03-09 16:42:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9762.1, 300 sec: 9677.7). Total num frames: 73003008. Throughput: 0: 9739.6. Samples: 72984756. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:42:08,995][744089] Avg episode reward: [(0, '479.086')]
+[2023-03-09 16:42:11,486][744402] Updated weights for policy 0, policy_version 142640 (0.0005)
+[2023-03-09 16:42:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 73052160. Throughput: 0: 9818.9. Samples: 73044132. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:42:13,995][744089] Avg episode reward: [(0, '512.917')]
+[2023-03-09 16:42:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000142680_73052160.pth...
+[2023-03-09 16:42:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000142112_72761344.pth
+[2023-03-09 16:42:15,587][744402] Updated weights for policy 0, policy_version 142720 (0.0005)
+[2023-03-09 16:42:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9677.7). Total num frames: 73101312. Throughput: 0: 9863.3. Samples: 73102744. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:42:18,995][744089] Avg episode reward: [(0, '535.350')]
+[2023-03-09 16:42:19,914][744402] Updated weights for policy 0, policy_version 142800 (0.0005)
+[2023-03-09 16:42:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9677.7). Total num frames: 73150464. Throughput: 0: 9886.3. Samples: 73132492. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-03-09 16:42:23,995][744089] Avg episode reward: [(0, '525.233')]
+[2023-03-09 16:42:24,214][744402] Updated weights for policy 0, policy_version 142880 (0.0005)
+[2023-03-09 16:42:28,451][744402] Updated weights for policy 0, policy_version 142960 (0.0005)
+[2023-03-09 16:42:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9677.7). Total num frames: 73199616. Throughput: 0: 9792.4. Samples: 73189648. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:42:28,996][744089] Avg episode reward: [(0, '536.918')]
+[2023-03-09 16:42:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000142968_73199616.pth...
+[2023-03-09 16:42:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000142400_72908800.pth
+[2023-03-09 16:42:32,682][744402] Updated weights for policy 0, policy_version 143040 (0.0005)
+[2023-03-09 16:42:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 73248768. Throughput: 0: 9742.7. Samples: 73248632. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:42:33,995][744089] Avg episode reward: [(0, '542.099')]
+[2023-03-09 16:42:36,831][744402] Updated weights for policy 0, policy_version 143120 (0.0005)
+[2023-03-09 16:42:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 73297920. Throughput: 0: 9752.8. Samples: 73277440. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:42:38,995][744089] Avg episode reward: [(0, '531.423')]
+[2023-03-09 16:42:40,938][744402] Updated weights for policy 0, policy_version 143200 (0.0005)
+[2023-03-09 16:42:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 73347072. Throughput: 0: 9742.2. Samples: 73335792. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:42:43,995][744089] Avg episode reward: [(0, '510.002')]
+[2023-03-09 16:42:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000143256_73347072.pth...
+[2023-03-09 16:42:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000142680_73052160.pth
+[2023-03-09 16:42:45,348][744402] Updated weights for policy 0, policy_version 143280 (0.0005)
+[2023-03-09 16:42:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 73392128. Throughput: 0: 9745.7. Samples: 73393372. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:42:48,995][744089] Avg episode reward: [(0, '516.166')]
+[2023-03-09 16:42:49,488][744402] Updated weights for policy 0, policy_version 143360 (0.0004)
+[2023-03-09 16:42:53,827][744402] Updated weights for policy 0, policy_version 143440 (0.0005)
+[2023-03-09 16:42:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 73441280. Throughput: 0: 9740.4. Samples: 73423072. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:42:53,995][744089] Avg episode reward: [(0, '514.676')]
+[2023-03-09 16:42:58,080][744402] Updated weights for policy 0, policy_version 143520 (0.0005)
+[2023-03-09 16:42:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 73490432. Throughput: 0: 9679.4. Samples: 73479704. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:42:58,995][744089] Avg episode reward: [(0, '497.437')]
+[2023-03-09 16:42:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000143536_73490432.pth...
+[2023-03-09 16:42:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000142968_73199616.pth
+[2023-03-09 16:43:01,996][744402] Updated weights for policy 0, policy_version 143600 (0.0005)
+[2023-03-09 16:43:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 73539584. Throughput: 0: 9741.2. Samples: 73541096. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:43:03,995][744089] Avg episode reward: [(0, '497.811')]
+[2023-03-09 16:43:06,092][744402] Updated weights for policy 0, policy_version 143680 (0.0005)
+[2023-03-09 16:43:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 73588736. Throughput: 0: 9746.3. Samples: 73571076. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:43:08,995][744089] Avg episode reward: [(0, '550.734')]
+[2023-03-09 16:43:10,272][744402] Updated weights for policy 0, policy_version 143760 (0.0005)
+[2023-03-09 16:43:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 73637888. Throughput: 0: 9778.8. Samples: 73629696. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:43:13,996][744089] Avg episode reward: [(0, '524.313')]
+[2023-03-09 16:43:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000143824_73637888.pth...
+[2023-03-09 16:43:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000143256_73347072.pth
+[2023-03-09 16:43:14,576][744402] Updated weights for policy 0, policy_version 143840 (0.0005)
+[2023-03-09 16:43:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 73682944. Throughput: 0: 9659.4. Samples: 73683304. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:43:18,996][744089] Avg episode reward: [(0, '473.270')]
+[2023-03-09 16:43:19,166][744402] Updated weights for policy 0, policy_version 143920 (0.0005)
+[2023-03-09 16:43:23,626][744402] Updated weights for policy 0, policy_version 144000 (0.0005)
+[2023-03-09 16:43:23,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 73728000. Throughput: 0: 9647.6. Samples: 73711580. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:43:23,995][744089] Avg episode reward: [(0, '546.916')]
+[2023-03-09 16:43:27,559][744402] Updated weights for policy 0, policy_version 144080 (0.0005)
+[2023-03-09 16:43:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 73781248. Throughput: 0: 9687.1. Samples: 73771712. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:43:28,995][744089] Avg episode reward: [(0, '498.599')]
+[2023-03-09 16:43:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000144104_73781248.pth...
+[2023-03-09 16:43:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000143536_73490432.pth
+[2023-03-09 16:43:31,737][744402] Updated weights for policy 0, policy_version 144160 (0.0005)
+[2023-03-09 16:43:33,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 73830400. Throughput: 0: 9705.7. Samples: 73830128. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:43:33,995][744089] Avg episode reward: [(0, '527.921')]
+[2023-03-09 16:43:36,009][744402] Updated weights for policy 0, policy_version 144240 (0.0005)
+[2023-03-09 16:43:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 73879552. Throughput: 0: 9681.3. Samples: 73858732. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:43:38,995][744089] Avg episode reward: [(0, '468.506')]
+[2023-03-09 16:43:40,229][744402] Updated weights for policy 0, policy_version 144320 (0.0005)
+[2023-03-09 16:43:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9691.5). Total num frames: 73924608. Throughput: 0: 9738.2. Samples: 73917924. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:43:43,996][744089] Avg episode reward: [(0, '509.609')]
+[2023-03-09 16:43:44,013][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000144392_73928704.pth...
+[2023-03-09 16:43:44,015][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000143824_73637888.pth
+[2023-03-09 16:43:44,507][744402] Updated weights for policy 0, policy_version 144400 (0.0005)
+[2023-03-09 16:43:48,846][744402] Updated weights for policy 0, policy_version 144480 (0.0005)
+[2023-03-09 16:43:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 73973760. Throughput: 0: 9614.4. Samples: 73973744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:43:48,995][744089] Avg episode reward: [(0, '547.339')]
+[2023-03-09 16:43:53,171][744402] Updated weights for policy 0, policy_version 144560 (0.0005)
+[2023-03-09 16:43:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 74022912. Throughput: 0: 9585.9. Samples: 74002440. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:43:53,995][744089] Avg episode reward: [(0, '441.198')]
+[2023-03-09 16:43:57,682][744402] Updated weights for policy 0, policy_version 144640 (0.0005)
+[2023-03-09 16:43:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9691.6). Total num frames: 74067968. Throughput: 0: 9491.0. Samples: 74056792. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:43:58,996][744089] Avg episode reward: [(0, '512.331')]
+[2023-03-09 16:43:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000144664_74067968.pth...
+[2023-03-09 16:43:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000144104_73781248.pth
+[2023-03-09 16:44:01,803][744402] Updated weights for policy 0, policy_version 144720 (0.0005)
+[2023-03-09 16:44:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9705.4). Total num frames: 74117120. Throughput: 0: 9637.8. Samples: 74117004. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:03,996][744089] Avg episode reward: [(0, '534.636')]
+[2023-03-09 16:44:06,013][744402] Updated weights for policy 0, policy_version 144800 (0.0005)
+[2023-03-09 16:44:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9691.6). Total num frames: 74162176. Throughput: 0: 9644.1. Samples: 74145564. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:08,996][744089] Avg episode reward: [(0, '532.545')]
+[2023-03-09 16:44:10,081][744402] Updated weights for policy 0, policy_version 144880 (0.0004)
+[2023-03-09 16:44:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9705.4). Total num frames: 74215424. Throughput: 0: 9622.4. Samples: 74204720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:13,996][744089] Avg episode reward: [(0, '521.926')]
+[2023-03-09 16:44:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000144952_74215424.pth...
+[2023-03-09 16:44:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000144392_73928704.pth
+[2023-03-09 16:44:14,398][744402] Updated weights for policy 0, policy_version 144960 (0.0005)
+[2023-03-09 16:44:18,629][744402] Updated weights for policy 0, policy_version 145040 (0.0005)
+[2023-03-09 16:44:18,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9691.6). Total num frames: 74260480. Throughput: 0: 9603.3. Samples: 74262276. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:18,995][744089] Avg episode reward: [(0, '496.412')]
+[2023-03-09 16:44:22,680][744402] Updated weights for policy 0, policy_version 145120 (0.0006)
+[2023-03-09 16:44:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9719.3). Total num frames: 74313728. Throughput: 0: 9656.1. Samples: 74293256. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:23,995][744089] Avg episode reward: [(0, '517.623')]
+[2023-03-09 16:44:26,702][744402] Updated weights for policy 0, policy_version 145200 (0.0005)
+[2023-03-09 16:44:28,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 74362880. Throughput: 0: 9660.8. Samples: 74352660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:28,996][744089] Avg episode reward: [(0, '511.665')]
+[2023-03-09 16:44:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000145240_74362880.pth...
+[2023-03-09 16:44:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000144664_74067968.pth
+[2023-03-09 16:44:30,967][744402] Updated weights for policy 0, policy_version 145280 (0.0005)
+[2023-03-09 16:44:33,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 74412032. Throughput: 0: 9725.9. Samples: 74411408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:33,995][744089] Avg episode reward: [(0, '534.795')]
+[2023-03-09 16:44:35,249][744402] Updated weights for policy 0, policy_version 145360 (0.0005)
+[2023-03-09 16:44:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 74457088. Throughput: 0: 9708.5. Samples: 74439320. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:38,995][744089] Avg episode reward: [(0, '531.241')]
+[2023-03-09 16:44:39,390][744402] Updated weights for policy 0, policy_version 145440 (0.0005)
+[2023-03-09 16:44:43,875][744402] Updated weights for policy 0, policy_version 145520 (0.0005)
+[2023-03-09 16:44:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 74506240. Throughput: 0: 9785.6. Samples: 74497144. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:43,995][744089] Avg episode reward: [(0, '450.601')]
+[2023-03-09 16:44:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000145520_74506240.pth...
+[2023-03-09 16:44:44,004][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000144952_74215424.pth
+[2023-03-09 16:44:48,221][744402] Updated weights for policy 0, policy_version 145600 (0.0005)
+[2023-03-09 16:44:48,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9625.6, 300 sec: 9705.4). Total num frames: 74551296. Throughput: 0: 9709.9. Samples: 74553952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:48,996][744089] Avg episode reward: [(0, '403.266')]
+[2023-03-09 16:44:52,486][744402] Updated weights for policy 0, policy_version 145680 (0.0005)
+[2023-03-09 16:44:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 74600448. Throughput: 0: 9691.2. Samples: 74581668. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:53,995][744089] Avg episode reward: [(0, '373.131')]
+[2023-03-09 16:44:56,934][744402] Updated weights for policy 0, policy_version 145760 (0.0005)
+[2023-03-09 16:44:58,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9691.6). Total num frames: 74645504. Throughput: 0: 9612.5. Samples: 74637284. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:44:58,995][744089] Avg episode reward: [(0, '393.589')]
+[2023-03-09 16:44:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000145792_74645504.pth...
+[2023-03-09 16:44:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000145240_74362880.pth
+[2023-03-09 16:45:01,151][744402] Updated weights for policy 0, policy_version 145840 (0.0005)
+[2023-03-09 16:45:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9691.5). Total num frames: 74694656. Throughput: 0: 9639.6. Samples: 74696060. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:45:03,995][744089] Avg episode reward: [(0, '370.479')]
+[2023-03-09 16:45:05,327][744402] Updated weights for policy 0, policy_version 145920 (0.0005)
+[2023-03-09 16:45:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 74743808. Throughput: 0: 9606.0. Samples: 74725524. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:45:08,995][744089] Avg episode reward: [(0, '357.916')]
+[2023-03-09 16:45:09,475][744402] Updated weights for policy 0, policy_version 146000 (0.0005)
+[2023-03-09 16:45:13,670][744402] Updated weights for policy 0, policy_version 146080 (0.0005)
+[2023-03-09 16:45:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9705.4). Total num frames: 74792960. Throughput: 0: 9603.8. Samples: 74784832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:45:13,995][744089] Avg episode reward: [(0, '395.363')]
+[2023-03-09 16:45:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000146080_74792960.pth...
+[2023-03-09 16:45:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000145520_74506240.pth
+[2023-03-09 16:45:17,926][744402] Updated weights for policy 0, policy_version 146160 (0.0005)
+[2023-03-09 16:45:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 74842112. Throughput: 0: 9572.8. Samples: 74842184. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:45:18,995][744089] Avg episode reward: [(0, '363.417')]
+[2023-03-09 16:45:22,260][744402] Updated weights for policy 0, policy_version 146240 (0.0005)
+[2023-03-09 16:45:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9705.4). Total num frames: 74891264. Throughput: 0: 9588.4. Samples: 74870800. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:45:23,995][744089] Avg episode reward: [(0, '429.916')]
+[2023-03-09 16:45:26,496][744402] Updated weights for policy 0, policy_version 146320 (0.0006)
+[2023-03-09 16:45:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9691.6). Total num frames: 74936320. Throughput: 0: 9591.5. Samples: 74928760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:45:28,995][744089] Avg episode reward: [(0, '467.315')]
+[2023-03-09 16:45:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000146360_74936320.pth...
+[2023-03-09 16:45:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000145792_74645504.pth
+[2023-03-09 16:45:30,878][744402] Updated weights for policy 0, policy_version 146400 (0.0006)
+[2023-03-09 16:45:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9691.6). Total num frames: 74985472. Throughput: 0: 9589.6. Samples: 74985484. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:45:33,995][744089] Avg episode reward: [(0, '410.422')]
+[2023-03-09 16:45:35,144][744402] Updated weights for policy 0, policy_version 146480 (0.0004)
+[2023-03-09 16:45:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9705.4). Total num frames: 75034624. Throughput: 0: 9612.2. Samples: 75014216. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:45:38,995][744089] Avg episode reward: [(0, '452.324')]
+[2023-03-09 16:45:39,354][744402] Updated weights for policy 0, policy_version 146560 (0.0005)
+[2023-03-09 16:45:43,624][744402] Updated weights for policy 0, policy_version 146640 (0.0005)
+[2023-03-09 16:45:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9677.7). Total num frames: 75079680. Throughput: 0: 9648.6. Samples: 75071472. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:45:43,995][744089] Avg episode reward: [(0, '434.931')]
+[2023-03-09 16:45:44,041][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000146648_75083776.pth...
+[2023-03-09 16:45:44,043][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000146080_74792960.pth
+[2023-03-09 16:45:47,952][744402] Updated weights for policy 0, policy_version 146720 (0.0005)
+[2023-03-09 16:45:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9691.6). Total num frames: 75128832. Throughput: 0: 9616.1. Samples: 75128784. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:45:48,995][744089] Avg episode reward: [(0, '440.124')]
+[2023-03-09 16:45:52,342][744402] Updated weights for policy 0, policy_version 146800 (0.0005)
+[2023-03-09 16:45:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9677.7). Total num frames: 75173888. Throughput: 0: 9597.3. Samples: 75157404. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:45:53,995][744089] Avg episode reward: [(0, '456.371')]
+[2023-03-09 16:45:56,796][744402] Updated weights for policy 0, policy_version 146880 (0.0005)
+[2023-03-09 16:45:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 75223040. Throughput: 0: 9494.9. Samples: 75212104. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:45:58,996][744089] Avg episode reward: [(0, '370.230')]
+[2023-03-09 16:45:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000146920_75223040.pth...
+[2023-03-09 16:45:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000146360_74936320.pth
+[2023-03-09 16:46:01,071][744402] Updated weights for policy 0, policy_version 146960 (0.0005)
+[2023-03-09 16:46:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 75268096. Throughput: 0: 9464.9. Samples: 75268104. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:46:03,995][744089] Avg episode reward: [(0, '417.928')]
+[2023-03-09 16:46:05,506][744402] Updated weights for policy 0, policy_version 147040 (0.0004)
+[2023-03-09 16:46:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 75317248. Throughput: 0: 9472.8. Samples: 75297076. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:46:08,995][744089] Avg episode reward: [(0, '432.313')]
+[2023-03-09 16:46:09,789][744402] Updated weights for policy 0, policy_version 147120 (0.0005)
+[2023-03-09 16:46:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9649.9). Total num frames: 75362304. Throughput: 0: 9451.5. Samples: 75354076. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:46:13,995][744089] Avg episode reward: [(0, '373.555')]
+[2023-03-09 16:46:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000147192_75362304.pth...
+[2023-03-09 16:46:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000146648_75083776.pth
+[2023-03-09 16:46:14,050][744402] Updated weights for policy 0, policy_version 147200 (0.0005)
+[2023-03-09 16:46:18,065][744402] Updated weights for policy 0, policy_version 147280 (0.0005)
+[2023-03-09 16:46:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 75415552. Throughput: 0: 9536.8. Samples: 75414640. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:46:18,996][744089] Avg episode reward: [(0, '351.625')]
+[2023-03-09 16:46:22,435][744402] Updated weights for policy 0, policy_version 147360 (0.0005)
+[2023-03-09 16:46:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9489.1, 300 sec: 9663.8). Total num frames: 75460608. Throughput: 0: 9518.8. Samples: 75442560. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:46:23,995][744089] Avg episode reward: [(0, '382.170')]
+[2023-03-09 16:46:26,728][744402] Updated weights for policy 0, policy_version 147440 (0.0005)
+[2023-03-09 16:46:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 75509760. Throughput: 0: 9501.0. Samples: 75499016. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:46:28,996][744089] Avg episode reward: [(0, '428.644')]
+[2023-03-09 16:46:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000147480_75509760.pth...
+[2023-03-09 16:46:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000146920_75223040.pth
+[2023-03-09 16:46:30,875][744402] Updated weights for policy 0, policy_version 147520 (0.0005)
+[2023-03-09 16:46:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 75558912. Throughput: 0: 9558.6. Samples: 75558924. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 16:46:33,996][744089] Avg episode reward: [(0, '394.305')]
+[2023-03-09 16:46:35,141][744402] Updated weights for policy 0, policy_version 147600 (0.0005)
+[2023-03-09 16:46:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9636.0). Total num frames: 75603968. Throughput: 0: 9559.5. Samples: 75587580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:46:38,995][744089] Avg episode reward: [(0, '411.453')]
+[2023-03-09 16:46:39,504][744402] Updated weights for policy 0, policy_version 147680 (0.0004)
+[2023-03-09 16:46:43,747][744402] Updated weights for policy 0, policy_version 147760 (0.0005)
+[2023-03-09 16:46:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9636.0). Total num frames: 75653120. Throughput: 0: 9597.4. Samples: 75643988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:46:43,995][744089] Avg episode reward: [(0, '370.508')]
+[2023-03-09 16:46:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000147760_75653120.pth...
+[2023-03-09 16:46:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000147192_75362304.pth
+[2023-03-09 16:46:47,957][744402] Updated weights for policy 0, policy_version 147840 (0.0005)
+[2023-03-09 16:46:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9636.0). Total num frames: 75702272. Throughput: 0: 9649.8. Samples: 75702344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:46:48,995][744089] Avg episode reward: [(0, '312.165')]
+[2023-03-09 16:46:52,324][744402] Updated weights for policy 0, policy_version 147920 (0.0006)
+[2023-03-09 16:46:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 75751424. Throughput: 0: 9639.1. Samples: 75730836. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:46:53,995][744089] Avg episode reward: [(0, '327.345')]
+[2023-03-09 16:46:56,276][744402] Updated weights for policy 0, policy_version 148000 (0.0005)
+[2023-03-09 16:46:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9649.9). Total num frames: 75800576. Throughput: 0: 9681.9. Samples: 75789764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:46:58,996][744089] Avg episode reward: [(0, '238.922')]
+[2023-03-09 16:46:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000148048_75800576.pth...
+[2023-03-09 16:46:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000147480_75509760.pth
+[2023-03-09 16:47:00,557][744402] Updated weights for policy 0, policy_version 148080 (0.0005)
+[2023-03-09 16:47:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 75845632. Throughput: 0: 9617.8. Samples: 75847440. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:03,995][744089] Avg episode reward: [(0, '364.163')]
+[2023-03-09 16:47:04,970][744402] Updated weights for policy 0, policy_version 148160 (0.0004)
+[2023-03-09 16:47:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9636.0). Total num frames: 75894784. Throughput: 0: 9630.9. Samples: 75875952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:08,995][744089] Avg episode reward: [(0, '311.695')]
+[2023-03-09 16:47:09,258][744402] Updated weights for policy 0, policy_version 148240 (0.0005)
+[2023-03-09 16:47:13,406][744402] Updated weights for policy 0, policy_version 148320 (0.0005)
+[2023-03-09 16:47:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9636.0). Total num frames: 75943936. Throughput: 0: 9646.5. Samples: 75933108. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:13,995][744089] Avg episode reward: [(0, '389.109')]
+[2023-03-09 16:47:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000148328_75943936.pth...
+[2023-03-09 16:47:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000147760_75653120.pth
+[2023-03-09 16:47:17,757][744402] Updated weights for policy 0, policy_version 148400 (0.0005)
+[2023-03-09 16:47:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9622.1). Total num frames: 75988992. Throughput: 0: 9607.8. Samples: 75991276. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:18,995][744089] Avg episode reward: [(0, '344.508')]
+[2023-03-09 16:47:22,134][744402] Updated weights for policy 0, policy_version 148480 (0.0005)
+[2023-03-09 16:47:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9622.1). Total num frames: 76038144. Throughput: 0: 9572.1. Samples: 76018324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:23,995][744089] Avg episode reward: [(0, '270.825')]
+[2023-03-09 16:47:26,323][744402] Updated weights for policy 0, policy_version 148560 (0.0005)
+[2023-03-09 16:47:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9608.2). Total num frames: 76083200. Throughput: 0: 9590.3. Samples: 76075552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:28,995][744089] Avg episode reward: [(0, '248.499')]
+[2023-03-09 16:47:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000148600_76083200.pth...
+[2023-03-09 16:47:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000148048_75800576.pth
+[2023-03-09 16:47:30,928][744402] Updated weights for policy 0, policy_version 148640 (0.0005)
+[2023-03-09 16:47:33,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9489.1, 300 sec: 9594.4). Total num frames: 76128256. Throughput: 0: 9488.8. Samples: 76129340. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:33,995][744089] Avg episode reward: [(0, '302.366')]
+[2023-03-09 16:47:35,368][744402] Updated weights for policy 0, policy_version 148720 (0.0005)
+[2023-03-09 16:47:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9594.4). Total num frames: 76177408. Throughput: 0: 9510.7. Samples: 76158816. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:38,995][744089] Avg episode reward: [(0, '298.053')]
+[2023-03-09 16:47:39,697][744402] Updated weights for policy 0, policy_version 148800 (0.0005)
+[2023-03-09 16:47:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9489.1, 300 sec: 9594.4). Total num frames: 76222464. Throughput: 0: 9434.9. Samples: 76214336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:43,995][744089] Avg episode reward: [(0, '336.873')]
+[2023-03-09 16:47:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000148872_76222464.pth...
+[2023-03-09 16:47:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000148328_75943936.pth
+[2023-03-09 16:47:44,213][744402] Updated weights for policy 0, policy_version 148880 (0.0005)
+[2023-03-09 16:47:48,118][744402] Updated weights for policy 0, policy_version 148960 (0.0005)
+[2023-03-09 16:47:48,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9557.3, 300 sec: 9608.2). Total num frames: 76275712. Throughput: 0: 9500.7. Samples: 76274972. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:48,995][744089] Avg episode reward: [(0, '341.026')]
+[2023-03-09 16:47:52,341][744402] Updated weights for policy 0, policy_version 149040 (0.0005)
+[2023-03-09 16:47:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9489.1, 300 sec: 9594.4). Total num frames: 76320768. Throughput: 0: 9518.8. Samples: 76304300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:53,995][744089] Avg episode reward: [(0, '321.711')]
+[2023-03-09 16:47:56,821][744402] Updated weights for policy 0, policy_version 149120 (0.0005)
+[2023-03-09 16:47:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9489.1, 300 sec: 9594.4). Total num frames: 76369920. Throughput: 0: 9464.6. Samples: 76359016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:47:58,996][744089] Avg episode reward: [(0, '275.294')]
+[2023-03-09 16:47:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000149160_76369920.pth...
+[2023-03-09 16:47:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000148600_76083200.pth
+[2023-03-09 16:48:00,953][744402] Updated weights for policy 0, policy_version 149200 (0.0005)
+[2023-03-09 16:48:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9594.4). Total num frames: 76419072. Throughput: 0: 9502.7. Samples: 76418900. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:03,996][744089] Avg episode reward: [(0, '339.286')]
+[2023-03-09 16:48:05,172][744402] Updated weights for policy 0, policy_version 149280 (0.0004)
+[2023-03-09 16:48:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9594.4). Total num frames: 76468224. Throughput: 0: 9534.0. Samples: 76447356. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:08,996][744089] Avg episode reward: [(0, '409.720')]
+[2023-03-09 16:48:09,404][744402] Updated weights for policy 0, policy_version 149360 (0.0005)
+[2023-03-09 16:48:13,782][744402] Updated weights for policy 0, policy_version 149440 (0.0004)
+[2023-03-09 16:48:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.0, 300 sec: 9594.4). Total num frames: 76513280. Throughput: 0: 9541.9. Samples: 76504940. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:13,996][744089] Avg episode reward: [(0, '435.311')]
+[2023-03-09 16:48:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000149440_76513280.pth...
+[2023-03-09 16:48:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000148872_76222464.pth
+[2023-03-09 16:48:17,744][744402] Updated weights for policy 0, policy_version 149520 (0.0005)
+[2023-03-09 16:48:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9608.2). Total num frames: 76562432. Throughput: 0: 9670.6. Samples: 76564516. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:18,995][744089] Avg episode reward: [(0, '438.261')]
+[2023-03-09 16:48:22,106][744402] Updated weights for policy 0, policy_version 149600 (0.0005)
+[2023-03-09 16:48:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9557.3, 300 sec: 9594.4). Total num frames: 76611584. Throughput: 0: 9633.2. Samples: 76592308. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:23,995][744089] Avg episode reward: [(0, '404.416')]
+[2023-03-09 16:48:26,481][744402] Updated weights for policy 0, policy_version 149680 (0.0005)
+[2023-03-09 16:48:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9580.5). Total num frames: 76656640. Throughput: 0: 9646.3. Samples: 76648420. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:28,996][744089] Avg episode reward: [(0, '415.722')]
+[2023-03-09 16:48:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000149720_76656640.pth...
+[2023-03-09 16:48:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000149160_76369920.pth
+[2023-03-09 16:48:30,766][744402] Updated weights for policy 0, policy_version 149760 (0.0005)
+[2023-03-09 16:48:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9580.5). Total num frames: 76705792. Throughput: 0: 9607.4. Samples: 76707304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:33,995][744089] Avg episode reward: [(0, '398.857')]
+[2023-03-09 16:48:35,021][744402] Updated weights for policy 0, policy_version 149840 (0.0004)
+[2023-03-09 16:48:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9594.4). Total num frames: 76754944. Throughput: 0: 9560.6. Samples: 76734528. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:38,995][744089] Avg episode reward: [(0, '435.161')]
+[2023-03-09 16:48:39,426][744402] Updated weights for policy 0, policy_version 149920 (0.0005)
+[2023-03-09 16:48:43,833][744402] Updated weights for policy 0, policy_version 150000 (0.0005)
+[2023-03-09 16:48:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9580.5). Total num frames: 76800000. Throughput: 0: 9599.5. Samples: 76790996. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:43,996][744089] Avg episode reward: [(0, '418.001')]
+[2023-03-09 16:48:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000150000_76800000.pth...
+[2023-03-09 16:48:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000149440_76513280.pth
+[2023-03-09 16:48:48,033][744402] Updated weights for policy 0, policy_version 150080 (0.0004)
+[2023-03-09 16:48:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9580.5). Total num frames: 76849152. Throughput: 0: 9557.9. Samples: 76849004. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:48,995][744089] Avg episode reward: [(0, '412.360')]
+[2023-03-09 16:48:52,221][744402] Updated weights for policy 0, policy_version 150160 (0.0005)
+[2023-03-09 16:48:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9594.4). Total num frames: 76898304. Throughput: 0: 9566.0. Samples: 76877824. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:53,995][744089] Avg episode reward: [(0, '442.105')]
+[2023-03-09 16:48:56,401][744402] Updated weights for policy 0, policy_version 150240 (0.0005)
+[2023-03-09 16:48:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9594.4). Total num frames: 76947456. Throughput: 0: 9570.9. Samples: 76935628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:48:58,996][744089] Avg episode reward: [(0, '457.838')]
+[2023-03-09 16:48:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000150288_76947456.pth...
+[2023-03-09 16:48:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000149720_76656640.pth
+[2023-03-09 16:49:00,633][744402] Updated weights for policy 0, policy_version 150320 (0.0005)
+[2023-03-09 16:49:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9594.4). Total num frames: 76992512. Throughput: 0: 9576.3. Samples: 76995452. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:03,995][744089] Avg episode reward: [(0, '485.453')]
+[2023-03-09 16:49:04,874][744402] Updated weights for policy 0, policy_version 150400 (0.0005)
+[2023-03-09 16:49:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9580.5). Total num frames: 77041664. Throughput: 0: 9589.1. Samples: 77023816. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:08,995][744089] Avg episode reward: [(0, '459.340')]
+[2023-03-09 16:49:09,249][744402] Updated weights for policy 0, policy_version 150480 (0.0005)
+[2023-03-09 16:49:13,389][744402] Updated weights for policy 0, policy_version 150560 (0.0004)
+[2023-03-09 16:49:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9594.4). Total num frames: 77090816. Throughput: 0: 9613.4. Samples: 77081024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:13,996][744089] Avg episode reward: [(0, '442.980')]
+[2023-03-09 16:49:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000150568_77090816.pth...
+[2023-03-09 16:49:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000150000_76800000.pth
+[2023-03-09 16:49:17,646][744402] Updated weights for policy 0, policy_version 150640 (0.0004)
+[2023-03-09 16:49:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9580.5). Total num frames: 77139968. Throughput: 0: 9601.0. Samples: 77139348. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:18,996][744089] Avg episode reward: [(0, '453.794')]
+[2023-03-09 16:49:21,883][744402] Updated weights for policy 0, policy_version 150720 (0.0005)
+[2023-03-09 16:49:23,995][744089] Fps is (10 sec: 9830.6, 60 sec: 9625.6, 300 sec: 9580.5). Total num frames: 77189120. Throughput: 0: 9646.1. Samples: 77168600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:23,995][744089] Avg episode reward: [(0, '454.031')]
+[2023-03-09 16:49:26,137][744402] Updated weights for policy 0, policy_version 150800 (0.0004)
+[2023-03-09 16:49:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9566.6). Total num frames: 77234176. Throughput: 0: 9667.8. Samples: 77226048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:28,995][744089] Avg episode reward: [(0, '414.516')]
+[2023-03-09 16:49:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000150848_77234176.pth...
+[2023-03-09 16:49:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000150288_76947456.pth
+[2023-03-09 16:49:30,419][744402] Updated weights for policy 0, policy_version 150880 (0.0005)
+[2023-03-09 16:49:33,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9625.6, 300 sec: 9580.5). Total num frames: 77283328. Throughput: 0: 9642.5. Samples: 77282916. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:33,996][744089] Avg episode reward: [(0, '414.534')]
+[2023-03-09 16:49:34,867][744402] Updated weights for policy 0, policy_version 150960 (0.0005)
+[2023-03-09 16:49:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9566.6). Total num frames: 77328384. Throughput: 0: 9620.8. Samples: 77310760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:38,996][744089] Avg episode reward: [(0, '436.418')]
+[2023-03-09 16:49:39,324][744402] Updated weights for policy 0, policy_version 151040 (0.0005)
+[2023-03-09 16:49:43,820][744402] Updated weights for policy 0, policy_version 151120 (0.0006)
+[2023-03-09 16:49:43,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9557.3, 300 sec: 9566.6). Total num frames: 77373440. Throughput: 0: 9528.3. Samples: 77364400. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:49:43,995][744089] Avg episode reward: [(0, '456.206')]
+[2023-03-09 16:49:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000151120_77373440.pth...
+[2023-03-09 16:49:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000150568_77090816.pth
+[2023-03-09 16:49:48,118][744402] Updated weights for policy 0, policy_version 151200 (0.0005)
+[2023-03-09 16:49:48,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9489.1, 300 sec: 9552.7). Total num frames: 77418496. Throughput: 0: 9474.4. Samples: 77421800. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:49:48,995][744089] Avg episode reward: [(0, '435.872')]
+[2023-03-09 16:49:52,460][744402] Updated weights for policy 0, policy_version 151280 (0.0005)
+[2023-03-09 16:49:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9566.6). Total num frames: 77467648. Throughput: 0: 9462.5. Samples: 77449628. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:49:53,995][744089] Avg episode reward: [(0, '458.843')]
+[2023-03-09 16:49:56,797][744402] Updated weights for policy 0, policy_version 151360 (0.0005)
+[2023-03-09 16:49:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.1, 300 sec: 9566.6). Total num frames: 77516800. Throughput: 0: 9472.4. Samples: 77507280. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:49:58,996][744089] Avg episode reward: [(0, '471.421')]
+[2023-03-09 16:49:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000151400_77516800.pth...
+[2023-03-09 16:49:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000150848_77234176.pth
+[2023-03-09 16:50:01,100][744402] Updated weights for policy 0, policy_version 151440 (0.0004)
+[2023-03-09 16:50:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9552.7). Total num frames: 77561856. Throughput: 0: 9387.6. Samples: 77561792. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:03,995][744089] Avg episode reward: [(0, '469.931')]
+[2023-03-09 16:50:05,588][744402] Updated weights for policy 0, policy_version 151520 (0.0005)
+[2023-03-09 16:50:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9420.8, 300 sec: 9538.8). Total num frames: 77606912. Throughput: 0: 9366.3. Samples: 77590084. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:08,996][744089] Avg episode reward: [(0, '381.351')]
+[2023-03-09 16:50:10,125][744402] Updated weights for policy 0, policy_version 151600 (0.0005)
+[2023-03-09 16:50:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9538.8). Total num frames: 77656064. Throughput: 0: 9326.3. Samples: 77645732. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:13,996][744089] Avg episode reward: [(0, '488.929')]
+[2023-03-09 16:50:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000151672_77656064.pth...
+[2023-03-09 16:50:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000151120_77373440.pth
+[2023-03-09 16:50:14,405][744402] Updated weights for policy 0, policy_version 151680 (0.0006)
+[2023-03-09 16:50:18,725][744402] Updated weights for policy 0, policy_version 151760 (0.0006)
+[2023-03-09 16:50:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9524.9). Total num frames: 77701120. Throughput: 0: 9304.7. Samples: 77701628. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:18,995][744089] Avg episode reward: [(0, '430.081')]
+[2023-03-09 16:50:22,986][744402] Updated weights for policy 0, policy_version 151840 (0.0005)
+[2023-03-09 16:50:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9352.5, 300 sec: 9538.8). Total num frames: 77750272. Throughput: 0: 9351.0. Samples: 77731556. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:23,995][744089] Avg episode reward: [(0, '497.578')]
+[2023-03-09 16:50:27,475][744402] Updated weights for policy 0, policy_version 151920 (0.0005)
+[2023-03-09 16:50:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9524.9). Total num frames: 77795328. Throughput: 0: 9390.1. Samples: 77786956. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:28,995][744089] Avg episode reward: [(0, '487.224')]
+[2023-03-09 16:50:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000151944_77795328.pth...
+[2023-03-09 16:50:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000151400_77516800.pth
+[2023-03-09 16:50:31,542][744402] Updated weights for policy 0, policy_version 152000 (0.0005)
+[2023-03-09 16:50:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.6, 300 sec: 9524.9). Total num frames: 77844480. Throughput: 0: 9431.3. Samples: 77846208. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:33,995][744089] Avg episode reward: [(0, '507.235')]
+[2023-03-09 16:50:35,794][744402] Updated weights for policy 0, policy_version 152080 (0.0004)
+[2023-03-09 16:50:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9538.8). Total num frames: 77893632. Throughput: 0: 9443.6. Samples: 77874592. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:38,995][744089] Avg episode reward: [(0, '479.111')]
+[2023-03-09 16:50:40,011][744402] Updated weights for policy 0, policy_version 152160 (0.0005)
+[2023-03-09 16:50:43,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9489.1, 300 sec: 9538.8). Total num frames: 77942784. Throughput: 0: 9458.1. Samples: 77932896. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:43,996][744089] Avg episode reward: [(0, '515.709')]
+[2023-03-09 16:50:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000152232_77942784.pth...
+[2023-03-09 16:50:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000151672_77656064.pth
+[2023-03-09 16:50:44,275][744402] Updated weights for policy 0, policy_version 152240 (0.0005)
+[2023-03-09 16:50:48,381][744402] Updated weights for policy 0, policy_version 152320 (0.0005)
+[2023-03-09 16:50:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9552.7). Total num frames: 77991936. Throughput: 0: 9559.0. Samples: 77991948. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 16:50:48,995][744089] Avg episode reward: [(0, '485.232')]
+[2023-03-09 16:50:52,544][744402] Updated weights for policy 0, policy_version 152400 (0.0005)
+[2023-03-09 16:50:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9552.7). Total num frames: 78041088. Throughput: 0: 9591.6. Samples: 78021708. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:50:53,996][744089] Avg episode reward: [(0, '426.841')]
+[2023-03-09 16:50:56,887][744402] Updated weights for policy 0, policy_version 152480 (0.0005)
+[2023-03-09 16:50:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9489.1, 300 sec: 9552.7). Total num frames: 78086144. Throughput: 0: 9605.1. Samples: 78077960. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:50:58,996][744089] Avg episode reward: [(0, '429.152')]
+[2023-03-09 16:50:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000152512_78086144.pth...
+[2023-03-09 16:50:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000151944_77795328.pth
+[2023-03-09 16:51:01,266][744402] Updated weights for policy 0, policy_version 152560 (0.0006)
+[2023-03-09 16:51:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9566.6). Total num frames: 78139392. Throughput: 0: 9710.6. Samples: 78138604. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:03,995][744089] Avg episode reward: [(0, '389.363')]
+[2023-03-09 16:51:05,301][744402] Updated weights for policy 0, policy_version 152640 (0.0005)
+[2023-03-09 16:51:08,995][744089] Fps is (10 sec: 9830.6, 60 sec: 9625.6, 300 sec: 9566.6). Total num frames: 78184448. Throughput: 0: 9690.7. Samples: 78167636. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:08,995][744089] Avg episode reward: [(0, '469.373')]
+[2023-03-09 16:51:09,615][744402] Updated weights for policy 0, policy_version 152720 (0.0005)
+[2023-03-09 16:51:13,865][744402] Updated weights for policy 0, policy_version 152800 (0.0005)
+[2023-03-09 16:51:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 78233600. Throughput: 0: 9716.4. Samples: 78224196. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:13,996][744089] Avg episode reward: [(0, '506.383')]
+[2023-03-09 16:51:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000152800_78233600.pth...
+[2023-03-09 16:51:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000152232_77942784.pth
+[2023-03-09 16:51:18,292][744402] Updated weights for policy 0, policy_version 152880 (0.0005)
+[2023-03-09 16:51:18,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 78278656. Throughput: 0: 9618.8. Samples: 78279056. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:18,996][744089] Avg episode reward: [(0, '462.211')]
+[2023-03-09 16:51:22,546][744402] Updated weights for policy 0, policy_version 152960 (0.0005)
+[2023-03-09 16:51:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 78327808. Throughput: 0: 9627.6. Samples: 78307832. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:23,995][744089] Avg episode reward: [(0, '491.867')]
+[2023-03-09 16:51:26,986][744402] Updated weights for policy 0, policy_version 153040 (0.0005)
+[2023-03-09 16:51:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9538.8). Total num frames: 78372864. Throughput: 0: 9594.2. Samples: 78364636. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:28,996][744089] Avg episode reward: [(0, '492.287')]
+[2023-03-09 16:51:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000153072_78372864.pth...
+[2023-03-09 16:51:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000152512_78086144.pth
+[2023-03-09 16:51:31,407][744402] Updated weights for policy 0, policy_version 153120 (0.0005)
+[2023-03-09 16:51:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 78422016. Throughput: 0: 9550.7. Samples: 78421732. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:33,996][744089] Avg episode reward: [(0, '520.516')]
+[2023-03-09 16:51:35,558][744402] Updated weights for policy 0, policy_version 153200 (0.0005)
+[2023-03-09 16:51:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 78471168. Throughput: 0: 9534.5. Samples: 78450760. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:38,995][744089] Avg episode reward: [(0, '479.479')]
+[2023-03-09 16:51:39,665][744402] Updated weights for policy 0, policy_version 153280 (0.0004)
+[2023-03-09 16:51:43,983][744402] Updated weights for policy 0, policy_version 153360 (0.0004)
+[2023-03-09 16:51:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 78520320. Throughput: 0: 9586.6. Samples: 78509356. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:43,995][744089] Avg episode reward: [(0, '493.412')]
+[2023-03-09 16:51:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000153360_78520320.pth...
+[2023-03-09 16:51:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000152800_78233600.pth
+[2023-03-09 16:51:48,189][744402] Updated weights for policy 0, policy_version 153440 (0.0005)
+[2023-03-09 16:51:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9538.8). Total num frames: 78565376. Throughput: 0: 9522.3. Samples: 78567108. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:48,995][744089] Avg episode reward: [(0, '501.993')]
+[2023-03-09 16:51:52,684][744402] Updated weights for policy 0, policy_version 153520 (0.0004)
+[2023-03-09 16:51:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9538.8). Total num frames: 78614528. Throughput: 0: 9474.6. Samples: 78593992. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:51:53,995][744089] Avg episode reward: [(0, '512.932')]
+[2023-03-09 16:51:56,968][744402] Updated weights for policy 0, policy_version 153600 (0.0005)
+[2023-03-09 16:51:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.4, 300 sec: 9538.8). Total num frames: 78659584. Throughput: 0: 9493.3. Samples: 78651392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:51:58,995][744089] Avg episode reward: [(0, '472.641')]
+[2023-03-09 16:51:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000153632_78659584.pth...
+[2023-03-09 16:51:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000153072_78372864.pth
+[2023-03-09 16:52:01,256][744402] Updated weights for policy 0, policy_version 153680 (0.0005)
+[2023-03-09 16:52:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9538.8). Total num frames: 78708736. Throughput: 0: 9556.1. Samples: 78709080. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:03,996][744089] Avg episode reward: [(0, '490.921')]
+[2023-03-09 16:52:05,472][744402] Updated weights for policy 0, policy_version 153760 (0.0004)
+[2023-03-09 16:52:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9538.8). Total num frames: 78757888. Throughput: 0: 9563.9. Samples: 78738208. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:08,995][744089] Avg episode reward: [(0, '500.584')]
+[2023-03-09 16:52:09,715][744402] Updated weights for policy 0, policy_version 153840 (0.0005)
+[2023-03-09 16:52:13,781][744402] Updated weights for policy 0, policy_version 153920 (0.0005)
+[2023-03-09 16:52:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9552.7). Total num frames: 78807040. Throughput: 0: 9649.4. Samples: 78798860. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:13,996][744089] Avg episode reward: [(0, '471.156')]
+[2023-03-09 16:52:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000153920_78807040.pth...
+[2023-03-09 16:52:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000153360_78520320.pth
+[2023-03-09 16:52:17,890][744402] Updated weights for policy 0, policy_version 154000 (0.0005)
+[2023-03-09 16:52:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 78856192. Throughput: 0: 9665.1. Samples: 78856660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:18,995][744089] Avg episode reward: [(0, '478.039')]
+[2023-03-09 16:52:22,061][744402] Updated weights for policy 0, policy_version 154080 (0.0005)
+[2023-03-09 16:52:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9566.6). Total num frames: 78905344. Throughput: 0: 9706.8. Samples: 78887568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:23,995][744089] Avg episode reward: [(0, '504.887')]
+[2023-03-09 16:52:26,040][744402] Updated weights for policy 0, policy_version 154160 (0.0005)
+[2023-03-09 16:52:28,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9762.2, 300 sec: 9594.4). Total num frames: 78958592. Throughput: 0: 9727.1. Samples: 78947076. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:28,995][744089] Avg episode reward: [(0, '447.825')]
+[2023-03-09 16:52:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000154216_78958592.pth...
+[2023-03-09 16:52:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000153632_78659584.pth
+[2023-03-09 16:52:30,199][744402] Updated weights for policy 0, policy_version 154240 (0.0005)
+[2023-03-09 16:52:33,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9594.4). Total num frames: 79007744. Throughput: 0: 9793.3. Samples: 79007808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:33,996][744089] Avg episode reward: [(0, '503.168')]
+[2023-03-09 16:52:34,234][744402] Updated weights for policy 0, policy_version 154320 (0.0005)
+[2023-03-09 16:52:38,445][744402] Updated weights for policy 0, policy_version 154400 (0.0005)
+[2023-03-09 16:52:38,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9608.2). Total num frames: 79056896. Throughput: 0: 9856.8. Samples: 79037548. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:38,995][744089] Avg episode reward: [(0, '520.491')]
+[2023-03-09 16:52:42,633][744402] Updated weights for policy 0, policy_version 154480 (0.0005)
+[2023-03-09 16:52:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9580.5). Total num frames: 79101952. Throughput: 0: 9870.8. Samples: 79095580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:43,995][744089] Avg episode reward: [(0, '533.697')]
+[2023-03-09 16:52:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000154504_79106048.pth...
+[2023-03-09 16:52:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000153920_78807040.pth
+[2023-03-09 16:52:47,031][744402] Updated weights for policy 0, policy_version 154560 (0.0005)
+[2023-03-09 16:52:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9594.4). Total num frames: 79151104. Throughput: 0: 9835.5. Samples: 79151676. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:48,995][744089] Avg episode reward: [(0, '519.731')]
+[2023-03-09 16:52:51,393][744402] Updated weights for policy 0, policy_version 154640 (0.0005)
+[2023-03-09 16:52:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9594.4). Total num frames: 79200256. Throughput: 0: 9811.9. Samples: 79179744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:53,995][744089] Avg episode reward: [(0, '539.093')]
+[2023-03-09 16:52:55,781][744402] Updated weights for policy 0, policy_version 154720 (0.0005)
+[2023-03-09 16:52:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9762.1, 300 sec: 9580.5). Total num frames: 79245312. Throughput: 0: 9713.5. Samples: 79235968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:52:58,995][744089] Avg episode reward: [(0, '523.012')]
+[2023-03-09 16:52:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000154776_79245312.pth...
+[2023-03-09 16:52:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000154216_78958592.pth
+[2023-03-09 16:53:00,268][744402] Updated weights for policy 0, policy_version 154800 (0.0006)
+[2023-03-09 16:53:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9580.5). Total num frames: 79294464. Throughput: 0: 9693.0. Samples: 79292844. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:03,995][744089] Avg episode reward: [(0, '532.366')]
+[2023-03-09 16:53:04,374][744402] Updated weights for policy 0, policy_version 154880 (0.0005)
+[2023-03-09 16:53:08,575][744402] Updated weights for policy 0, policy_version 154960 (0.0005)
+[2023-03-09 16:53:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9594.4). Total num frames: 79343616. Throughput: 0: 9664.3. Samples: 79322460. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:08,995][744089] Avg episode reward: [(0, '516.725')]
+[2023-03-09 16:53:12,778][744402] Updated weights for policy 0, policy_version 155040 (0.0005)
+[2023-03-09 16:53:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9594.4). Total num frames: 79392768. Throughput: 0: 9632.8. Samples: 79380552. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:13,995][744089] Avg episode reward: [(0, '536.975')]
+[2023-03-09 16:53:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000155064_79392768.pth...
+[2023-03-09 16:53:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000154504_79106048.pth
+[2023-03-09 16:53:16,958][744402] Updated weights for policy 0, policy_version 155120 (0.0004)
+[2023-03-09 16:53:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9580.5). Total num frames: 79437824. Throughput: 0: 9591.2. Samples: 79439412. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:18,995][744089] Avg episode reward: [(0, '551.951')]
+[2023-03-09 16:53:21,267][744402] Updated weights for policy 0, policy_version 155200 (0.0005)
+[2023-03-09 16:53:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9594.4). Total num frames: 79486976. Throughput: 0: 9553.7. Samples: 79467464. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:23,996][744089] Avg episode reward: [(0, '548.979')]
+[2023-03-09 16:53:25,399][744402] Updated weights for policy 0, policy_version 155280 (0.0004)
+[2023-03-09 16:53:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9594.4). Total num frames: 79536128. Throughput: 0: 9573.4. Samples: 79526384. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:28,996][744089] Avg episode reward: [(0, '507.790')]
+[2023-03-09 16:53:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000155344_79536128.pth...
+[2023-03-09 16:53:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000154776_79245312.pth
+[2023-03-09 16:53:29,831][744402] Updated weights for policy 0, policy_version 155360 (0.0005)
+[2023-03-09 16:53:33,937][744402] Updated weights for policy 0, policy_version 155440 (0.0004)
+[2023-03-09 16:53:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9594.4). Total num frames: 79585280. Throughput: 0: 9618.8. Samples: 79584520. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:33,995][744089] Avg episode reward: [(0, '537.038')]
+[2023-03-09 16:53:38,206][744402] Updated weights for policy 0, policy_version 155520 (0.0006)
+[2023-03-09 16:53:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9594.4). Total num frames: 79630336. Throughput: 0: 9646.7. Samples: 79613844. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:38,995][744089] Avg episode reward: [(0, '530.154')]
+[2023-03-09 16:53:42,217][744402] Updated weights for policy 0, policy_version 155600 (0.0005)
+[2023-03-09 16:53:43,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9608.2). Total num frames: 79683584. Throughput: 0: 9697.8. Samples: 79672368. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:43,995][744089] Avg episode reward: [(0, '533.457')]
+[2023-03-09 16:53:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000155632_79683584.pth...
+[2023-03-09 16:53:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000155064_79392768.pth
+[2023-03-09 16:53:46,417][744402] Updated weights for policy 0, policy_version 155680 (0.0005)
+[2023-03-09 16:53:48,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9608.2). Total num frames: 79732736. Throughput: 0: 9775.4. Samples: 79732736. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:48,995][744089] Avg episode reward: [(0, '518.233')]
+[2023-03-09 16:53:50,573][744402] Updated weights for policy 0, policy_version 155760 (0.0004)
+[2023-03-09 16:53:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9594.4). Total num frames: 79777792. Throughput: 0: 9752.6. Samples: 79761324. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:53,995][744089] Avg episode reward: [(0, '537.991')]
+[2023-03-09 16:53:54,921][744402] Updated weights for policy 0, policy_version 155840 (0.0005)
+[2023-03-09 16:53:58,699][744402] Updated weights for policy 0, policy_version 155920 (0.0005)
+[2023-03-09 16:53:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9622.1). Total num frames: 79831040. Throughput: 0: 9828.4. Samples: 79822828. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:53:58,995][744089] Avg episode reward: [(0, '523.992')]
+[2023-03-09 16:53:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000155920_79831040.pth...
+[2023-03-09 16:53:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000155344_79536128.pth
+[2023-03-09 16:54:03,008][744402] Updated weights for policy 0, policy_version 156000 (0.0005)
+[2023-03-09 16:54:03,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9762.1, 300 sec: 9622.1). Total num frames: 79880192. Throughput: 0: 9793.3. Samples: 79880112. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:03,995][744089] Avg episode reward: [(0, '538.453')]
+[2023-03-09 16:54:07,314][744402] Updated weights for policy 0, policy_version 156080 (0.0005)
+[2023-03-09 16:54:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9622.1). Total num frames: 79929344. Throughput: 0: 9808.1. Samples: 79908828. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:08,995][744089] Avg episode reward: [(0, '542.535')]
+[2023-03-09 16:54:11,455][744402] Updated weights for policy 0, policy_version 156160 (0.0005)
+[2023-03-09 16:54:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9608.2). Total num frames: 79974400. Throughput: 0: 9778.7. Samples: 79966424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:13,995][744089] Avg episode reward: [(0, '534.148')]
+[2023-03-09 16:54:13,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000156200_79974400.pth...
+[2023-03-09 16:54:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000155632_79683584.pth
+[2023-03-09 16:54:15,674][744402] Updated weights for policy 0, policy_version 156240 (0.0005)
+[2023-03-09 16:54:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9608.2). Total num frames: 80023552. Throughput: 0: 9776.2. Samples: 80024448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:18,995][744089] Avg episode reward: [(0, '547.200')]
+[2023-03-09 16:54:20,042][744402] Updated weights for policy 0, policy_version 156320 (0.0005)
+[2023-03-09 16:54:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9622.1). Total num frames: 80072704. Throughput: 0: 9786.7. Samples: 80054248. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:23,996][744089] Avg episode reward: [(0, '524.034')]
+[2023-03-09 16:54:24,259][744402] Updated weights for policy 0, policy_version 156400 (0.0005)
+[2023-03-09 16:54:28,222][744402] Updated weights for policy 0, policy_version 156480 (0.0005)
+[2023-03-09 16:54:28,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9636.0). Total num frames: 80125952. Throughput: 0: 9798.0. Samples: 80113276. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:28,995][744089] Avg episode reward: [(0, '532.144')]
+[2023-03-09 16:54:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000156496_80125952.pth...
+[2023-03-09 16:54:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000155920_79831040.pth
+[2023-03-09 16:54:32,388][744402] Updated weights for policy 0, policy_version 156560 (0.0005)
+[2023-03-09 16:54:33,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9636.0). Total num frames: 80171008. Throughput: 0: 9784.5. Samples: 80173036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:33,995][744089] Avg episode reward: [(0, '546.494')]
+[2023-03-09 16:54:36,549][744402] Updated weights for policy 0, policy_version 156640 (0.0005)
+[2023-03-09 16:54:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9830.4, 300 sec: 9649.9). Total num frames: 80220160. Throughput: 0: 9815.7. Samples: 80203028. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:38,995][744089] Avg episode reward: [(0, '549.243')]
+[2023-03-09 16:54:40,834][744402] Updated weights for policy 0, policy_version 156720 (0.0005)
+[2023-03-09 16:54:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 80269312. Throughput: 0: 9737.9. Samples: 80261036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:43,995][744089] Avg episode reward: [(0, '524.315')]
+[2023-03-09 16:54:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000156776_80269312.pth...
+[2023-03-09 16:54:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000156200_79974400.pth
+[2023-03-09 16:54:45,055][744402] Updated weights for policy 0, policy_version 156800 (0.0004)
+[2023-03-09 16:54:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9663.8). Total num frames: 80318464. Throughput: 0: 9740.7. Samples: 80318444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:48,995][744089] Avg episode reward: [(0, '543.361')]
+[2023-03-09 16:54:49,256][744402] Updated weights for policy 0, policy_version 156880 (0.0005)
+[2023-03-09 16:54:53,371][744402] Updated weights for policy 0, policy_version 156960 (0.0004)
+[2023-03-09 16:54:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9663.8). Total num frames: 80367616. Throughput: 0: 9756.6. Samples: 80347872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:53,995][744089] Avg episode reward: [(0, '540.683')]
+[2023-03-09 16:54:57,244][744402] Updated weights for policy 0, policy_version 157040 (0.0005)
+[2023-03-09 16:54:58,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 80420864. Throughput: 0: 9851.6. Samples: 80409748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:54:58,996][744089] Avg episode reward: [(0, '545.409')]
+[2023-03-09 16:54:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000157072_80420864.pth...
+[2023-03-09 16:54:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000156496_80125952.pth
+[2023-03-09 16:55:01,425][744402] Updated weights for policy 0, policy_version 157120 (0.0005)
+[2023-03-09 16:55:03,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9830.4, 300 sec: 9705.4). Total num frames: 80470016. Throughput: 0: 9901.7. Samples: 80470024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:55:03,995][744089] Avg episode reward: [(0, '533.546')]
+[2023-03-09 16:55:05,480][744402] Updated weights for policy 0, policy_version 157200 (0.0005)
+[2023-03-09 16:55:08,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9719.3). Total num frames: 80523264. Throughput: 0: 9938.7. Samples: 80501488. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:08,995][744089] Avg episode reward: [(0, '530.019')]
+[2023-03-09 16:55:09,268][744402] Updated weights for policy 0, policy_version 157280 (0.0005)
+[2023-03-09 16:55:13,445][744402] Updated weights for policy 0, policy_version 157360 (0.0005)
+[2023-03-09 16:55:13,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9733.2). Total num frames: 80572416. Throughput: 0: 9986.3. Samples: 80562660. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:13,995][744089] Avg episode reward: [(0, '543.078')]
+[2023-03-09 16:55:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000157368_80572416.pth...
+[2023-03-09 16:55:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000156776_80269312.pth
+[2023-03-09 16:55:17,492][744402] Updated weights for policy 0, policy_version 157440 (0.0005)
+[2023-03-09 16:55:18,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9966.9, 300 sec: 9733.2). Total num frames: 80621568. Throughput: 0: 9966.6. Samples: 80621532. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:18,995][744089] Avg episode reward: [(0, '531.302')]
+[2023-03-09 16:55:21,888][744402] Updated weights for policy 0, policy_version 157520 (0.0004)
+[2023-03-09 16:55:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9966.9, 300 sec: 9747.1). Total num frames: 80670720. Throughput: 0: 9936.1. Samples: 80650156. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:23,996][744089] Avg episode reward: [(0, '530.895')]
+[2023-03-09 16:55:25,999][744402] Updated weights for policy 0, policy_version 157600 (0.0005)
+[2023-03-09 16:55:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9747.1). Total num frames: 80719872. Throughput: 0: 9985.0. Samples: 80710360. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:28,995][744089] Avg episode reward: [(0, '537.927')]
+[2023-03-09 16:55:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000157656_80719872.pth...
+[2023-03-09 16:55:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000157072_80420864.pth
+[2023-03-09 16:55:30,141][744402] Updated weights for policy 0, policy_version 157680 (0.0005)
+[2023-03-09 16:55:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9898.7, 300 sec: 9733.2). Total num frames: 80764928. Throughput: 0: 9921.5. Samples: 80764912. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:33,995][744089] Avg episode reward: [(0, '533.561')]
+[2023-03-09 16:55:34,614][744402] Updated weights for policy 0, policy_version 157760 (0.0005)
+[2023-03-09 16:55:38,576][744402] Updated weights for policy 0, policy_version 157840 (0.0005)
+[2023-03-09 16:55:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9898.7, 300 sec: 9733.2). Total num frames: 80814080. Throughput: 0: 9957.2. Samples: 80795944. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:38,995][744089] Avg episode reward: [(0, '534.708')]
+[2023-03-09 16:55:42,697][744402] Updated weights for policy 0, policy_version 157920 (0.0005)
+[2023-03-09 16:55:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9733.2). Total num frames: 80863232. Throughput: 0: 9913.6. Samples: 80855860. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:43,995][744089] Avg episode reward: [(0, '521.089')]
+[2023-03-09 16:55:44,043][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000157944_80867328.pth...
+[2023-03-09 16:55:44,044][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000157368_80572416.pth
+[2023-03-09 16:55:46,783][744402] Updated weights for policy 0, policy_version 158000 (0.0005)
+[2023-03-09 16:55:48,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9966.9, 300 sec: 9747.1). Total num frames: 80916480. Throughput: 0: 9920.5. Samples: 80916448. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:48,995][744089] Avg episode reward: [(0, '567.026')]
+[2023-03-09 16:55:50,988][744402] Updated weights for policy 0, policy_version 158080 (0.0005)
+[2023-03-09 16:55:53,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9966.9, 300 sec: 9761.0). Total num frames: 80965632. Throughput: 0: 9859.5. Samples: 80945164. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:53,996][744089] Avg episode reward: [(0, '557.879')]
+[2023-03-09 16:55:55,265][744402] Updated weights for policy 0, policy_version 158160 (0.0005)
+[2023-03-09 16:55:58,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 81010688. Throughput: 0: 9776.5. Samples: 81002600. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:55:58,995][744089] Avg episode reward: [(0, '533.149')]
+[2023-03-09 16:55:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000158224_81010688.pth...
+[2023-03-09 16:55:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000157656_80719872.pth
+[2023-03-09 16:55:59,561][744402] Updated weights for policy 0, policy_version 158240 (0.0005)
+[2023-03-09 16:56:03,778][744402] Updated weights for policy 0, policy_version 158320 (0.0005)
+[2023-03-09 16:56:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 81059840. Throughput: 0: 9741.8. Samples: 81059912. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:56:03,996][744089] Avg episode reward: [(0, '549.175')]
+[2023-03-09 16:56:08,079][744402] Updated weights for policy 0, policy_version 158400 (0.0005)
+[2023-03-09 16:56:08,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 81108992. Throughput: 0: 9752.6. Samples: 81089024. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-03-09 16:56:08,996][744089] Avg episode reward: [(0, '545.774')]
+[2023-03-09 16:56:12,256][744402] Updated weights for policy 0, policy_version 158480 (0.0005)
+[2023-03-09 16:56:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9761.0). Total num frames: 81158144. Throughput: 0: 9717.4. Samples: 81147644. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:13,995][744089] Avg episode reward: [(0, '543.215')]
+[2023-03-09 16:56:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000158512_81158144.pth...
+[2023-03-09 16:56:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000157944_80867328.pth
+[2023-03-09 16:56:16,601][744402] Updated weights for policy 0, policy_version 158560 (0.0005)
+[2023-03-09 16:56:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9747.1). Total num frames: 81203200. Throughput: 0: 9778.5. Samples: 81204944. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:18,995][744089] Avg episode reward: [(0, '553.751')]
+[2023-03-09 16:56:20,864][744402] Updated weights for policy 0, policy_version 158640 (0.0005)
+[2023-03-09 16:56:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 81252352. Throughput: 0: 9711.4. Samples: 81232960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:23,996][744089] Avg episode reward: [(0, '550.202')]
+[2023-03-09 16:56:25,157][744402] Updated weights for policy 0, policy_version 158720 (0.0005)
+[2023-03-09 16:56:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 81301504. Throughput: 0: 9643.6. Samples: 81289824. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:28,996][744089] Avg episode reward: [(0, '550.170')]
+[2023-03-09 16:56:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000158792_81301504.pth...
+[2023-03-09 16:56:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000158224_81010688.pth
+[2023-03-09 16:56:29,274][744402] Updated weights for policy 0, policy_version 158800 (0.0006)
+[2023-03-09 16:56:33,339][744402] Updated weights for policy 0, policy_version 158880 (0.0005)
+[2023-03-09 16:56:33,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 81354752. Throughput: 0: 9686.0. Samples: 81352320. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:33,996][744089] Avg episode reward: [(0, '550.395')]
+[2023-03-09 16:56:37,052][744402] Updated weights for policy 0, policy_version 158960 (0.0005)
+[2023-03-09 16:56:38,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 81403904. Throughput: 0: 9758.1. Samples: 81384276. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:38,995][744089] Avg episode reward: [(0, '543.670')]
+[2023-03-09 16:56:41,023][744402] Updated weights for policy 0, policy_version 159040 (0.0005)
+[2023-03-09 16:56:43,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9898.7, 300 sec: 9802.6). Total num frames: 81457152. Throughput: 0: 9871.5. Samples: 81446820. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:43,995][744089] Avg episode reward: [(0, '564.325')]
+[2023-03-09 16:56:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000159096_81457152.pth...
+[2023-03-09 16:56:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000158512_81158144.pth
+[2023-03-09 16:56:45,111][744402] Updated weights for policy 0, policy_version 159120 (0.0005)
+[2023-03-09 16:56:48,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9830.4, 300 sec: 9802.6). Total num frames: 81506304. Throughput: 0: 9930.3. Samples: 81506776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:49,006][744089] Avg episode reward: [(0, '568.899')]
+[2023-03-09 16:56:49,065][744402] Updated weights for policy 0, policy_version 159200 (0.0005)
+[2023-03-09 16:56:53,051][744402] Updated weights for policy 0, policy_version 159280 (0.0005)
+[2023-03-09 16:56:53,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9830.4). Total num frames: 81559552. Throughput: 0: 9995.5. Samples: 81538820. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:54,006][744089] Avg episode reward: [(0, '572.562')]
+[2023-03-09 16:56:57,142][744402] Updated weights for policy 0, policy_version 159360 (0.0005)
+[2023-03-09 16:56:58,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9830.4). Total num frames: 81608704. Throughput: 0: 10061.1. Samples: 81600392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:56:59,006][744089] Avg episode reward: [(0, '557.774')]
+[2023-03-09 16:56:59,010][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000159392_81608704.pth...
+[2023-03-09 16:56:59,013][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000158792_81301504.pth
+[2023-03-09 16:57:01,063][744402] Updated weights for policy 0, policy_version 159440 (0.0005)
+[2023-03-09 16:57:03,995][744089] Fps is (10 sec: 10240.0, 60 sec: 10035.2, 300 sec: 9844.3). Total num frames: 81661952. Throughput: 0: 10143.8. Samples: 81661416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:04,006][744089] Avg episode reward: [(0, '539.121')]
+[2023-03-09 16:57:05,309][744402] Updated weights for policy 0, policy_version 159520 (0.0005)
+[2023-03-09 16:57:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9967.0, 300 sec: 9830.4). Total num frames: 81707008. Throughput: 0: 10095.4. Samples: 81687252. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:08,995][744089] Avg episode reward: [(0, '523.988')]
+[2023-03-09 16:57:09,617][744402] Updated weights for policy 0, policy_version 159600 (0.0005)
+[2023-03-09 16:57:13,683][744402] Updated weights for policy 0, policy_version 159680 (0.0005)
+[2023-03-09 16:57:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9966.9, 300 sec: 9830.4). Total num frames: 81756160. Throughput: 0: 10178.3. Samples: 81747848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:13,995][744089] Avg episode reward: [(0, '524.727')]
+[2023-03-09 16:57:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000159680_81756160.pth...
+[2023-03-09 16:57:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000159096_81457152.pth
+[2023-03-09 16:57:17,983][744402] Updated weights for policy 0, policy_version 159760 (0.0005)
+[2023-03-09 16:57:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 10035.2, 300 sec: 9830.4). Total num frames: 81805312. Throughput: 0: 10064.5. Samples: 81805220. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:18,995][744089] Avg episode reward: [(0, '542.403')]
+[2023-03-09 16:57:22,289][744402] Updated weights for policy 0, policy_version 159840 (0.0004)
+[2023-03-09 16:57:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 10035.2, 300 sec: 9816.5). Total num frames: 81854464. Throughput: 0: 9991.4. Samples: 81833888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:23,996][744089] Avg episode reward: [(0, '539.567')]
+[2023-03-09 16:57:26,263][744402] Updated weights for policy 0, policy_version 159920 (0.0005)
+[2023-03-09 16:57:28,995][744089] Fps is (10 sec: 10240.1, 60 sec: 10103.5, 300 sec: 9830.4). Total num frames: 81907712. Throughput: 0: 9976.4. Samples: 81895756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:28,995][744089] Avg episode reward: [(0, '549.240')]
+[2023-03-09 16:57:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000159976_81907712.pth...
+[2023-03-09 16:57:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000159392_81608704.pth
+[2023-03-09 16:57:29,928][744402] Updated weights for policy 0, policy_version 160000 (0.0004)
+[2023-03-09 16:57:33,831][744402] Updated weights for policy 0, policy_version 160080 (0.0005)
+[2023-03-09 16:57:33,995][744089] Fps is (10 sec: 10649.6, 60 sec: 10103.5, 300 sec: 9844.3). Total num frames: 81960960. Throughput: 0: 10093.2. Samples: 81960968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:33,996][744089] Avg episode reward: [(0, '555.636')]
+[2023-03-09 16:57:37,901][744402] Updated weights for policy 0, policy_version 160160 (0.0005)
+[2023-03-09 16:57:38,995][744089] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 9858.2). Total num frames: 82010112. Throughput: 0: 10028.4. Samples: 81990100. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:38,996][744089] Avg episode reward: [(0, '540.596')]
+[2023-03-09 16:57:42,283][744402] Updated weights for policy 0, policy_version 160240 (0.0004)
+[2023-03-09 16:57:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9966.9, 300 sec: 9844.3). Total num frames: 82055168. Throughput: 0: 9930.1. Samples: 82047248. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:43,995][744089] Avg episode reward: [(0, '558.489')]
+[2023-03-09 16:57:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000160264_82055168.pth...
+[2023-03-09 16:57:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000159680_81756160.pth
+[2023-03-09 16:57:46,450][744402] Updated weights for policy 0, policy_version 160320 (0.0005)
+[2023-03-09 16:57:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9966.9, 300 sec: 9844.3). Total num frames: 82104320. Throughput: 0: 9907.5. Samples: 82107252. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:48,996][744089] Avg episode reward: [(0, '570.190')]
+[2023-03-09 16:57:50,549][744402] Updated weights for policy 0, policy_version 160400 (0.0006)
+[2023-03-09 16:57:53,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9966.9, 300 sec: 9872.1). Total num frames: 82157568. Throughput: 0: 9994.7. Samples: 82137016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:53,996][744089] Avg episode reward: [(0, '566.711')]
+[2023-03-09 16:57:54,859][744402] Updated weights for policy 0, policy_version 160480 (0.0005)
+[2023-03-09 16:57:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9858.2). Total num frames: 82202624. Throughput: 0: 9925.5. Samples: 82194496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:57:58,995][744089] Avg episode reward: [(0, '568.028')]
+[2023-03-09 16:57:59,030][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000160560_82206720.pth...
+[2023-03-09 16:57:59,031][744402] Updated weights for policy 0, policy_version 160560 (0.0005)
+[2023-03-09 16:57:59,032][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000159976_81907712.pth
+[2023-03-09 16:58:03,118][744402] Updated weights for policy 0, policy_version 160640 (0.0005)
+[2023-03-09 16:58:03,995][744089] Fps is (10 sec: 9830.6, 60 sec: 9898.7, 300 sec: 9872.1). Total num frames: 82255872. Throughput: 0: 10015.9. Samples: 82255936. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:58:03,995][744089] Avg episode reward: [(0, '563.189')]
+[2023-03-09 16:58:06,865][744402] Updated weights for policy 0, policy_version 160720 (0.0005)
+[2023-03-09 16:58:08,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9872.1). Total num frames: 82305024. Throughput: 0: 10104.0. Samples: 82288568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:58:08,995][744089] Avg episode reward: [(0, '567.145')]
+[2023-03-09 16:58:11,320][744402] Updated weights for policy 0, policy_version 160800 (0.0004)
+[2023-03-09 16:58:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9885.9). Total num frames: 82354176. Throughput: 0: 10006.5. Samples: 82346048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:58:13,995][744089] Avg episode reward: [(0, '568.607')]
+[2023-03-09 16:58:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000160848_82354176.pth...
+[2023-03-09 16:58:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000160264_82055168.pth
+[2023-03-09 16:58:15,314][744402] Updated weights for policy 0, policy_version 160880 (0.0005)
+[2023-03-09 16:58:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9885.9). Total num frames: 82403328. Throughput: 0: 9830.2. Samples: 82403328. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 16:58:18,995][744089] Avg episode reward: [(0, '555.992')]
+[2023-03-09 16:58:19,735][744402] Updated weights for policy 0, policy_version 160960 (0.0004)
+[2023-03-09 16:58:23,737][744402] Updated weights for policy 0, policy_version 161040 (0.0005)
+[2023-03-09 16:58:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9966.9, 300 sec: 9885.9). Total num frames: 82452480. Throughput: 0: 9820.0. Samples: 82432000. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:58:23,996][744089] Avg episode reward: [(0, '563.281')]
+[2023-03-09 16:58:27,866][744402] Updated weights for policy 0, policy_version 161120 (0.0005)
+[2023-03-09 16:58:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9885.9). Total num frames: 82501632. Throughput: 0: 9914.8. Samples: 82493416. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:58:28,996][744089] Avg episode reward: [(0, '552.134')]
+[2023-03-09 16:58:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000161136_82501632.pth...
+[2023-03-09 16:58:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000160560_82206720.pth
+[2023-03-09 16:58:32,159][744402] Updated weights for policy 0, policy_version 161200 (0.0005)
+[2023-03-09 16:58:33,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9899.8). Total num frames: 82550784. Throughput: 0: 9856.3. Samples: 82550784. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:58:33,995][744089] Avg episode reward: [(0, '565.605')]
+[2023-03-09 16:58:36,260][744402] Updated weights for policy 0, policy_version 161280 (0.0005)
+[2023-03-09 16:58:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9885.9). Total num frames: 82599936. Throughput: 0: 9852.1. Samples: 82580360. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:58:38,996][744089] Avg episode reward: [(0, '571.751')]
+[2023-03-09 16:58:40,763][744402] Updated weights for policy 0, policy_version 161360 (0.0005)
+[2023-03-09 16:58:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9830.4, 300 sec: 9872.1). Total num frames: 82644992. Throughput: 0: 9827.8. Samples: 82636748. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:58:43,995][744089] Avg episode reward: [(0, '578.325')]
+[2023-03-09 16:58:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000161416_82644992.pth...
+[2023-03-09 16:58:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000160848_82354176.pth
+[2023-03-09 16:58:45,124][744402] Updated weights for policy 0, policy_version 161440 (0.0004)
+[2023-03-09 16:58:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9885.9). Total num frames: 82694144. Throughput: 0: 9737.8. Samples: 82694140. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:58:48,996][744089] Avg episode reward: [(0, '558.532')]
+[2023-03-09 16:58:49,324][744402] Updated weights for policy 0, policy_version 161520 (0.0005)
+[2023-03-09 16:58:53,263][744402] Updated weights for policy 0, policy_version 161600 (0.0004)
+[2023-03-09 16:58:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.2, 300 sec: 9872.1). Total num frames: 82743296. Throughput: 0: 9649.8. Samples: 82722808. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:58:53,995][744089] Avg episode reward: [(0, '567.625')]
+[2023-03-09 16:58:57,514][744402] Updated weights for policy 0, policy_version 161680 (0.0005)
+[2023-03-09 16:58:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9872.1). Total num frames: 82792448. Throughput: 0: 9729.3. Samples: 82783868. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:58:58,996][744089] Avg episode reward: [(0, '569.222')]
+[2023-03-09 16:58:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000161704_82792448.pth...
+[2023-03-09 16:58:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000161136_82501632.pth
+[2023-03-09 16:59:01,782][744402] Updated weights for policy 0, policy_version 161760 (0.0005)
+[2023-03-09 16:59:03,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9872.1). Total num frames: 82841600. Throughput: 0: 9768.6. Samples: 82842912. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:59:03,995][744089] Avg episode reward: [(0, '575.350')]
+[2023-03-09 16:59:05,817][744402] Updated weights for policy 0, policy_version 161840 (0.0005)
+[2023-03-09 16:59:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9885.9). Total num frames: 82890752. Throughput: 0: 9747.1. Samples: 82870620. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:59:08,996][744089] Avg episode reward: [(0, '579.897')]
+[2023-03-09 16:59:10,138][744402] Updated weights for policy 0, policy_version 161920 (0.0005)
+[2023-03-09 16:59:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9885.9). Total num frames: 82939904. Throughput: 0: 9703.5. Samples: 82930076. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:59:13,996][744089] Avg episode reward: [(0, '564.286')]
+[2023-03-09 16:59:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000161992_82939904.pth...
+[2023-03-09 16:59:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000161416_82644992.pth
+[2023-03-09 16:59:14,306][744402] Updated weights for policy 0, policy_version 162000 (0.0005)
+[2023-03-09 16:59:18,419][744402] Updated weights for policy 0, policy_version 162080 (0.0005)
+[2023-03-09 16:59:18,995][744089] Fps is (10 sec: 9830.6, 60 sec: 9762.2, 300 sec: 9885.9). Total num frames: 82989056. Throughput: 0: 9741.0. Samples: 82989128. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:59:18,995][744089] Avg episode reward: [(0, '572.252')]
+[2023-03-09 16:59:22,797][744402] Updated weights for policy 0, policy_version 162160 (0.0005)
+[2023-03-09 16:59:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9872.1). Total num frames: 83038208. Throughput: 0: 9709.0. Samples: 83017264. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 16:59:23,996][744089] Avg episode reward: [(0, '576.819')]
+[2023-03-09 16:59:26,830][744402] Updated weights for policy 0, policy_version 162240 (0.0005)
+[2023-03-09 16:59:28,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9762.1, 300 sec: 9885.9). Total num frames: 83087360. Throughput: 0: 9754.6. Samples: 83075704. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:59:28,996][744089] Avg episode reward: [(0, '568.234')]
+[2023-03-09 16:59:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000162280_83087360.pth...
+[2023-03-09 16:59:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000161704_82792448.pth
+[2023-03-09 16:59:31,098][744402] Updated weights for policy 0, policy_version 162320 (0.0005)
+[2023-03-09 16:59:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9885.9). Total num frames: 83136512. Throughput: 0: 9827.7. Samples: 83136388. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:59:33,996][744089] Avg episode reward: [(0, '559.801')]
+[2023-03-09 16:59:35,162][744402] Updated weights for policy 0, policy_version 162400 (0.0005)
+[2023-03-09 16:59:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9885.9). Total num frames: 83185664. Throughput: 0: 9832.3. Samples: 83165260. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:59:38,995][744089] Avg episode reward: [(0, '566.328')]
+[2023-03-09 16:59:39,226][744402] Updated weights for policy 0, policy_version 162480 (0.0005)
+[2023-03-09 16:59:43,538][744402] Updated weights for policy 0, policy_version 162560 (0.0004)
+[2023-03-09 16:59:43,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9885.9). Total num frames: 83234816. Throughput: 0: 9773.5. Samples: 83223676. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:59:43,995][744089] Avg episode reward: [(0, '549.369')]
+[2023-03-09 16:59:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000162568_83234816.pth...
+[2023-03-09 16:59:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000161992_82939904.pth
+[2023-03-09 16:59:47,604][744402] Updated weights for policy 0, policy_version 162640 (0.0005)
+[2023-03-09 16:59:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9885.9). Total num frames: 83283968. Throughput: 0: 9792.5. Samples: 83283576. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:59:48,995][744089] Avg episode reward: [(0, '524.912')]
+[2023-03-09 16:59:52,030][744402] Updated weights for policy 0, policy_version 162720 (0.0004)
+[2023-03-09 16:59:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9858.2). Total num frames: 83329024. Throughput: 0: 9793.6. Samples: 83311332. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:59:53,995][744089] Avg episode reward: [(0, '526.066')]
+[2023-03-09 16:59:56,430][744402] Updated weights for policy 0, policy_version 162800 (0.0004)
+[2023-03-09 16:59:58,995][744089] Fps is (10 sec: 9011.1, 60 sec: 9693.9, 300 sec: 9844.3). Total num frames: 83374080. Throughput: 0: 9701.2. Samples: 83366632. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 16:59:58,995][744089] Avg episode reward: [(0, '527.314')]
+[2023-03-09 16:59:59,014][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000162848_83378176.pth...
+[2023-03-09 16:59:59,015][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000162280_83087360.pth
+[2023-03-09 17:00:00,726][744402] Updated weights for policy 0, policy_version 162880 (0.0005)
+[2023-03-09 17:00:03,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9830.4). Total num frames: 83423232. Throughput: 0: 9658.2. Samples: 83423748. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:00:03,995][744089] Avg episode reward: [(0, '542.679')]
+[2023-03-09 17:00:05,071][744402] Updated weights for policy 0, policy_version 162960 (0.0005)
+[2023-03-09 17:00:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9830.4). Total num frames: 83472384. Throughput: 0: 9685.0. Samples: 83453088. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:00:08,995][744089] Avg episode reward: [(0, '553.702')]
+[2023-03-09 17:00:09,180][744402] Updated weights for policy 0, policy_version 163040 (0.0005)
+[2023-03-09 17:00:13,299][744402] Updated weights for policy 0, policy_version 163120 (0.0005)
+[2023-03-09 17:00:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9830.4). Total num frames: 83521536. Throughput: 0: 9722.6. Samples: 83513220. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:00:13,996][744089] Avg episode reward: [(0, '570.038')]
+[2023-03-09 17:00:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000163128_83521536.pth...
+[2023-03-09 17:00:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000162568_83234816.pth
+[2023-03-09 17:00:17,643][744402] Updated weights for policy 0, policy_version 163200 (0.0005)
+[2023-03-09 17:00:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.8, 300 sec: 9830.4). Total num frames: 83570688. Throughput: 0: 9652.9. Samples: 83570768. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:00:18,996][744089] Avg episode reward: [(0, '563.203')]
+[2023-03-09 17:00:21,571][744402] Updated weights for policy 0, policy_version 163280 (0.0005)
+[2023-03-09 17:00:23,995][744089] Fps is (10 sec: 9830.6, 60 sec: 9693.9, 300 sec: 9830.4). Total num frames: 83619840. Throughput: 0: 9705.3. Samples: 83601996. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:00:23,995][744089] Avg episode reward: [(0, '559.121')]
+[2023-03-09 17:00:25,894][744402] Updated weights for policy 0, policy_version 163360 (0.0005)
+[2023-03-09 17:00:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9844.3). Total num frames: 83668992. Throughput: 0: 9648.6. Samples: 83657864. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:00:28,996][744089] Avg episode reward: [(0, '565.132')]
+[2023-03-09 17:00:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000163416_83668992.pth...
+[2023-03-09 17:00:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000162848_83378176.pth
+[2023-03-09 17:00:30,176][744402] Updated weights for policy 0, policy_version 163440 (0.0005)
+[2023-03-09 17:00:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9844.3). Total num frames: 83718144. Throughput: 0: 9629.8. Samples: 83716916. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:00:33,995][744089] Avg episode reward: [(0, '555.266')]
+[2023-03-09 17:00:34,394][744402] Updated weights for policy 0, policy_version 163520 (0.0005)
+[2023-03-09 17:00:38,743][744402] Updated weights for policy 0, policy_version 163600 (0.0006)
+[2023-03-09 17:00:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9830.4). Total num frames: 83763200. Throughput: 0: 9644.1. Samples: 83745316. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:00:38,996][744089] Avg episode reward: [(0, '553.414')]
+[2023-03-09 17:00:42,893][744402] Updated weights for policy 0, policy_version 163680 (0.0006)
+[2023-03-09 17:00:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9816.5). Total num frames: 83812352. Throughput: 0: 9721.1. Samples: 83804080. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:00:43,995][744089] Avg episode reward: [(0, '569.966')]
+[2023-03-09 17:00:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000163696_83812352.pth...
+[2023-03-09 17:00:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000163128_83521536.pth
+[2023-03-09 17:00:47,282][744402] Updated weights for policy 0, policy_version 163760 (0.0005)
+[2023-03-09 17:00:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9816.5). Total num frames: 83861504. Throughput: 0: 9708.9. Samples: 83860648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:00:48,996][744089] Avg episode reward: [(0, '574.346')]
+[2023-03-09 17:00:51,438][744402] Updated weights for policy 0, policy_version 163840 (0.0005)
+[2023-03-09 17:00:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9830.4). Total num frames: 83910656. Throughput: 0: 9710.2. Samples: 83890048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:00:53,995][744089] Avg episode reward: [(0, '568.193')]
+[2023-03-09 17:00:55,655][744402] Updated weights for policy 0, policy_version 163920 (0.0005)
+[2023-03-09 17:00:58,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9830.4). Total num frames: 83959808. Throughput: 0: 9659.0. Samples: 83947872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:00:58,995][744089] Avg episode reward: [(0, '575.675')]
+[2023-03-09 17:00:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000163984_83959808.pth...
+[2023-03-09 17:00:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000163416_83668992.pth
+[2023-03-09 17:00:59,749][744402] Updated weights for policy 0, policy_version 164000 (0.0006)
+[2023-03-09 17:01:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9816.5). Total num frames: 84004864. Throughput: 0: 9643.6. Samples: 84004732. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:03,995][744089] Avg episode reward: [(0, '578.969')]
+[2023-03-09 17:01:04,284][744402] Updated weights for policy 0, policy_version 164080 (0.0005)
+[2023-03-09 17:01:08,439][744402] Updated weights for policy 0, policy_version 164160 (0.0005)
+[2023-03-09 17:01:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9816.5). Total num frames: 84054016. Throughput: 0: 9608.4. Samples: 84034376. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:08,996][744089] Avg episode reward: [(0, '561.057')]
+[2023-03-09 17:01:12,773][744402] Updated weights for policy 0, policy_version 164240 (0.0005)
+[2023-03-09 17:01:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9816.5). Total num frames: 84099072. Throughput: 0: 9624.2. Samples: 84090952. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:13,996][744089] Avg episode reward: [(0, '557.966')]
+[2023-03-09 17:01:14,032][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000164264_84103168.pth...
+[2023-03-09 17:01:14,034][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000163696_83812352.pth
+[2023-03-09 17:01:17,038][744402] Updated weights for policy 0, policy_version 164320 (0.0005)
+[2023-03-09 17:01:17,495][744358] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000004
+[2023-03-09 17:01:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9816.5). Total num frames: 84148224. Throughput: 0: 9596.5. Samples: 84148756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:18,995][744089] Avg episode reward: [(0, '576.455')]
+[2023-03-09 17:01:21,263][744402] Updated weights for policy 0, policy_version 164400 (0.0005)
+[2023-03-09 17:01:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9816.5). Total num frames: 84197376. Throughput: 0: 9628.4. Samples: 84178592. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:23,995][744089] Avg episode reward: [(0, '577.606')]
+[2023-03-09 17:01:25,462][744402] Updated weights for policy 0, policy_version 164480 (0.0005)
+[2023-03-09 17:01:28,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9625.6, 300 sec: 9802.6). Total num frames: 84246528. Throughput: 0: 9650.0. Samples: 84238332. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:28,996][744089] Avg episode reward: [(0, '576.608')]
+[2023-03-09 17:01:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000164544_84246528.pth...
+[2023-03-09 17:01:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000163984_83959808.pth
+[2023-03-09 17:01:29,669][744402] Updated weights for policy 0, policy_version 164560 (0.0005)
+[2023-03-09 17:01:33,962][744402] Updated weights for policy 0, policy_version 164640 (0.0005)
+[2023-03-09 17:01:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9802.6). Total num frames: 84295680. Throughput: 0: 9652.9. Samples: 84295028. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:33,995][744089] Avg episode reward: [(0, '578.315')]
+[2023-03-09 17:01:38,250][744402] Updated weights for policy 0, policy_version 164720 (0.0005)
+[2023-03-09 17:01:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9774.9). Total num frames: 84340736. Throughput: 0: 9650.4. Samples: 84324316. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:38,995][744089] Avg episode reward: [(0, '573.354')]
+[2023-03-09 17:01:42,493][744402] Updated weights for policy 0, policy_version 164800 (0.0005)
+[2023-03-09 17:01:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9774.9). Total num frames: 84389888. Throughput: 0: 9632.0. Samples: 84381312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:43,995][744089] Avg episode reward: [(0, '563.153')]
+[2023-03-09 17:01:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000164824_84389888.pth...
+[2023-03-09 17:01:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000164264_84103168.pth
+[2023-03-09 17:01:46,731][744402] Updated weights for policy 0, policy_version 164880 (0.0005)
+[2023-03-09 17:01:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9761.0). Total num frames: 84439040. Throughput: 0: 9709.7. Samples: 84441668. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:48,996][744089] Avg episode reward: [(0, '553.076')]
+[2023-03-09 17:01:50,760][744402] Updated weights for policy 0, policy_version 164960 (0.0005)
+[2023-03-09 17:01:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9761.0). Total num frames: 84488192. Throughput: 0: 9676.1. Samples: 84469800. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:54,011][744089] Avg episode reward: [(0, '542.792')]
+[2023-03-09 17:01:55,029][744402] Updated weights for policy 0, policy_version 165040 (0.0005)
+[2023-03-09 17:01:58,937][744402] Updated weights for policy 0, policy_version 165120 (0.0005)
+[2023-03-09 17:01:58,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 84541440. Throughput: 0: 9752.9. Samples: 84529832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:01:58,995][744089] Avg episode reward: [(0, '557.613')]
+[2023-03-09 17:01:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000165120_84541440.pth...
+[2023-03-09 17:01:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000164544_84246528.pth
+[2023-03-09 17:02:03,433][744402] Updated weights for policy 0, policy_version 165200 (0.0005)
+[2023-03-09 17:02:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 84586496. Throughput: 0: 9726.9. Samples: 84586468. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:03,995][744089] Avg episode reward: [(0, '552.731')]
+[2023-03-09 17:02:07,563][744402] Updated weights for policy 0, policy_version 165280 (0.0005)
+[2023-03-09 17:02:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 84635648. Throughput: 0: 9738.3. Samples: 84616816. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:08,995][744089] Avg episode reward: [(0, '538.272')]
+[2023-03-09 17:02:11,744][744402] Updated weights for policy 0, policy_version 165360 (0.0005)
+[2023-03-09 17:02:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9761.0). Total num frames: 84684800. Throughput: 0: 9689.5. Samples: 84674360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:13,995][744089] Avg episode reward: [(0, '550.596')]
+[2023-03-09 17:02:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000165400_84684800.pth...
+[2023-03-09 17:02:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000164824_84389888.pth
+[2023-03-09 17:02:15,972][744402] Updated weights for policy 0, policy_version 165440 (0.0005)
+[2023-03-09 17:02:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9761.0). Total num frames: 84733952. Throughput: 0: 9751.8. Samples: 84733860. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:18,995][744089] Avg episode reward: [(0, '534.151')]
+[2023-03-09 17:02:20,284][744402] Updated weights for policy 0, policy_version 165520 (0.0005)
+[2023-03-09 17:02:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 84779008. Throughput: 0: 9704.0. Samples: 84760996. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:23,995][744089] Avg episode reward: [(0, '539.176')]
+[2023-03-09 17:02:24,569][744402] Updated weights for policy 0, policy_version 165600 (0.0005)
+[2023-03-09 17:02:28,802][744402] Updated weights for policy 0, policy_version 165680 (0.0005)
+[2023-03-09 17:02:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 84828160. Throughput: 0: 9719.0. Samples: 84818668. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:28,996][744089] Avg episode reward: [(0, '555.607')]
+[2023-03-09 17:02:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000165680_84828160.pth...
+[2023-03-09 17:02:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000165120_84541440.pth
+[2023-03-09 17:02:33,102][744402] Updated weights for policy 0, policy_version 165760 (0.0005)
+[2023-03-09 17:02:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 84877312. Throughput: 0: 9658.8. Samples: 84876312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:33,995][744089] Avg episode reward: [(0, '571.056')]
+[2023-03-09 17:02:37,409][744402] Updated weights for policy 0, policy_version 165840 (0.0005)
+[2023-03-09 17:02:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 84922368. Throughput: 0: 9671.6. Samples: 84905020. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:38,995][744089] Avg episode reward: [(0, '548.753')]
+[2023-03-09 17:02:41,637][744402] Updated weights for policy 0, policy_version 165920 (0.0005)
+[2023-03-09 17:02:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 84971520. Throughput: 0: 9610.0. Samples: 84962284. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:43,996][744089] Avg episode reward: [(0, '539.370')]
+[2023-03-09 17:02:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000165960_84971520.pth...
+[2023-03-09 17:02:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000165400_84684800.pth
+[2023-03-09 17:02:45,778][744402] Updated weights for policy 0, policy_version 166000 (0.0005)
+[2023-03-09 17:02:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 85020672. Throughput: 0: 9688.9. Samples: 85022468. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:48,995][744089] Avg episode reward: [(0, '551.182')]
+[2023-03-09 17:02:49,967][744402] Updated weights for policy 0, policy_version 166080 (0.0004)
+[2023-03-09 17:02:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 85069824. Throughput: 0: 9628.0. Samples: 85050076. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:53,996][744089] Avg episode reward: [(0, '557.282')]
+[2023-03-09 17:02:54,365][744402] Updated weights for policy 0, policy_version 166160 (0.0005)
+[2023-03-09 17:02:58,600][744402] Updated weights for policy 0, policy_version 166240 (0.0005)
+[2023-03-09 17:02:58,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9625.6, 300 sec: 9705.4). Total num frames: 85118976. Throughput: 0: 9638.2. Samples: 85108080. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:02:58,996][744089] Avg episode reward: [(0, '535.982')]
+[2023-03-09 17:02:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000166248_85118976.pth...
+[2023-03-09 17:02:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000165680_84828160.pth
+[2023-03-09 17:03:02,558][744402] Updated weights for policy 0, policy_version 166320 (0.0004)
+[2023-03-09 17:03:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 85168128. Throughput: 0: 9645.6. Samples: 85167912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:03,995][744089] Avg episode reward: [(0, '547.370')]
+[2023-03-09 17:03:06,828][744402] Updated weights for policy 0, policy_version 166400 (0.0005)
+[2023-03-09 17:03:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 85217280. Throughput: 0: 9685.1. Samples: 85196828. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:08,995][744089] Avg episode reward: [(0, '546.856')]
+[2023-03-09 17:03:10,846][744402] Updated weights for policy 0, policy_version 166480 (0.0005)
+[2023-03-09 17:03:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 85266432. Throughput: 0: 9767.6. Samples: 85258208. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:13,995][744089] Avg episode reward: [(0, '520.510')]
+[2023-03-09 17:03:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000166536_85266432.pth...
+[2023-03-09 17:03:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000165960_84971520.pth
+[2023-03-09 17:03:14,999][744402] Updated weights for policy 0, policy_version 166560 (0.0005)
+[2023-03-09 17:03:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 85315584. Throughput: 0: 9784.2. Samples: 85316600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:18,995][744089] Avg episode reward: [(0, '525.725')]
+[2023-03-09 17:03:19,100][744402] Updated weights for policy 0, policy_version 166640 (0.0005)
+[2023-03-09 17:03:23,484][744402] Updated weights for policy 0, policy_version 166720 (0.0005)
+[2023-03-09 17:03:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 85364736. Throughput: 0: 9793.8. Samples: 85345744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:23,996][744089] Avg episode reward: [(0, '548.453')]
+[2023-03-09 17:03:27,940][744402] Updated weights for policy 0, policy_version 166800 (0.0005)
+[2023-03-09 17:03:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9691.5). Total num frames: 85409792. Throughput: 0: 9723.0. Samples: 85399820. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:28,996][744089] Avg episode reward: [(0, '560.535')]
+[2023-03-09 17:03:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000166816_85409792.pth...
+[2023-03-09 17:03:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000166248_85118976.pth
+[2023-03-09 17:03:32,254][744402] Updated weights for policy 0, policy_version 166880 (0.0004)
+[2023-03-09 17:03:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 85458944. Throughput: 0: 9693.9. Samples: 85458696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:33,995][744089] Avg episode reward: [(0, '557.163')]
+[2023-03-09 17:03:36,256][744402] Updated weights for policy 0, policy_version 166960 (0.0004)
+[2023-03-09 17:03:38,995][744089] Fps is (10 sec: 9830.6, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 85508096. Throughput: 0: 9768.4. Samples: 85489652. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:39,006][744089] Avg episode reward: [(0, '561.418')]
+[2023-03-09 17:03:40,540][744402] Updated weights for policy 0, policy_version 167040 (0.0005)
+[2023-03-09 17:03:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 85557248. Throughput: 0: 9758.1. Samples: 85547196. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:44,006][744089] Avg episode reward: [(0, '538.291')]
+[2023-03-09 17:03:44,010][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000167104_85557248.pth...
+[2023-03-09 17:03:44,013][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000166536_85266432.pth
+[2023-03-09 17:03:44,866][744402] Updated weights for policy 0, policy_version 167120 (0.0005)
+[2023-03-09 17:03:48,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 85602304. Throughput: 0: 9653.3. Samples: 85602312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:48,995][744089] Avg episode reward: [(0, '554.270')]
+[2023-03-09 17:03:49,250][744402] Updated weights for policy 0, policy_version 167200 (0.0005)
+[2023-03-09 17:03:53,538][744402] Updated weights for policy 0, policy_version 167280 (0.0005)
+[2023-03-09 17:03:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 85651456. Throughput: 0: 9644.2. Samples: 85630816. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:53,996][744089] Avg episode reward: [(0, '566.118')]
+[2023-03-09 17:03:57,979][744402] Updated weights for policy 0, policy_version 167360 (0.0005)
+[2023-03-09 17:03:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 85696512. Throughput: 0: 9548.6. Samples: 85687896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:03:58,996][744089] Avg episode reward: [(0, '553.928')]
+[2023-03-09 17:03:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000167376_85696512.pth...
+[2023-03-09 17:03:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000166816_85409792.pth
+[2023-03-09 17:04:02,360][744402] Updated weights for policy 0, policy_version 167440 (0.0005)
+[2023-03-09 17:04:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 85741568. Throughput: 0: 9449.9. Samples: 85741844. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:03,996][744089] Avg episode reward: [(0, '563.358')]
+[2023-03-09 17:04:06,733][744402] Updated weights for policy 0, policy_version 167520 (0.0005)
+[2023-03-09 17:04:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9663.8). Total num frames: 85790720. Throughput: 0: 9443.7. Samples: 85770712. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:08,996][744089] Avg episode reward: [(0, '541.087')]
+[2023-03-09 17:04:10,972][744402] Updated weights for policy 0, policy_version 167600 (0.0004)
+[2023-03-09 17:04:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9649.9). Total num frames: 85835776. Throughput: 0: 9516.8. Samples: 85828076. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:13,995][744089] Avg episode reward: [(0, '567.026')]
+[2023-03-09 17:04:14,023][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000167656_85839872.pth...
+[2023-03-09 17:04:14,024][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000167104_85557248.pth
+[2023-03-09 17:04:15,327][744402] Updated weights for policy 0, policy_version 167680 (0.0005)
+[2023-03-09 17:04:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9649.9). Total num frames: 85884928. Throughput: 0: 9530.3. Samples: 85887560. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:18,995][744089] Avg episode reward: [(0, '562.869')]
+[2023-03-09 17:04:19,493][744402] Updated weights for policy 0, policy_version 167760 (0.0005)
+[2023-03-09 17:04:23,773][744402] Updated weights for policy 0, policy_version 167840 (0.0005)
+[2023-03-09 17:04:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9489.1, 300 sec: 9649.9). Total num frames: 85934080. Throughput: 0: 9460.4. Samples: 85915372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:23,996][744089] Avg episode reward: [(0, '559.370')]
+[2023-03-09 17:04:28,024][744402] Updated weights for policy 0, policy_version 167920 (0.0005)
+[2023-03-09 17:04:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 85983232. Throughput: 0: 9448.8. Samples: 85972392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:28,996][744089] Avg episode reward: [(0, '542.805')]
+[2023-03-09 17:04:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000167936_85983232.pth...
+[2023-03-09 17:04:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000167376_85696512.pth
+[2023-03-09 17:04:32,001][744402] Updated weights for policy 0, policy_version 168000 (0.0005)
+[2023-03-09 17:04:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 86032384. Throughput: 0: 9577.6. Samples: 86033304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:33,995][744089] Avg episode reward: [(0, '525.159')]
+[2023-03-09 17:04:36,151][744402] Updated weights for policy 0, policy_version 168080 (0.0005)
+[2023-03-09 17:04:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 86081536. Throughput: 0: 9624.0. Samples: 86063896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:39,006][744089] Avg episode reward: [(0, '550.446')]
+[2023-03-09 17:04:40,499][744402] Updated weights for policy 0, policy_version 168160 (0.0004)
+[2023-03-09 17:04:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 86130688. Throughput: 0: 9625.6. Samples: 86121048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:44,006][744089] Avg episode reward: [(0, '542.580')]
+[2023-03-09 17:04:44,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000168224_86130688.pth...
+[2023-03-09 17:04:44,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000167656_85839872.pth
+[2023-03-09 17:04:44,606][744402] Updated weights for policy 0, policy_version 168240 (0.0005)
+[2023-03-09 17:04:48,771][744402] Updated weights for policy 0, policy_version 168320 (0.0005)
+[2023-03-09 17:04:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 86179840. Throughput: 0: 9734.9. Samples: 86179912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:48,995][744089] Avg episode reward: [(0, '556.961')]
+[2023-03-09 17:04:52,786][744402] Updated weights for policy 0, policy_version 168400 (0.0005)
+[2023-03-09 17:04:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 86228992. Throughput: 0: 9765.2. Samples: 86210144. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:53,995][744089] Avg episode reward: [(0, '549.234')]
+[2023-03-09 17:04:56,770][744402] Updated weights for policy 0, policy_version 168480 (0.0005)
+[2023-03-09 17:04:58,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 86282240. Throughput: 0: 9910.0. Samples: 86274024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:04:58,995][744089] Avg episode reward: [(0, '557.666')]
+[2023-03-09 17:04:59,057][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000168528_86286336.pth...
+[2023-03-09 17:04:59,059][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000167936_85983232.pth
+[2023-03-09 17:05:00,713][744402] Updated weights for policy 0, policy_version 168560 (0.0005)
+[2023-03-09 17:05:03,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 86331392. Throughput: 0: 9916.0. Samples: 86333780. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:03,995][744089] Avg episode reward: [(0, '556.355')]
+[2023-03-09 17:05:04,913][744402] Updated weights for policy 0, policy_version 168640 (0.0005)
+[2023-03-09 17:05:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 86380544. Throughput: 0: 9892.0. Samples: 86360512. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:08,995][744089] Avg episode reward: [(0, '553.645')]
+[2023-03-09 17:05:09,144][744402] Updated weights for policy 0, policy_version 168720 (0.0005)
+[2023-03-09 17:05:13,258][744402] Updated weights for policy 0, policy_version 168800 (0.0005)
+[2023-03-09 17:05:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9691.6). Total num frames: 86429696. Throughput: 0: 9981.7. Samples: 86421568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:13,996][744089] Avg episode reward: [(0, '533.983')]
+[2023-03-09 17:05:14,022][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000168816_86433792.pth...
+[2023-03-09 17:05:14,024][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000168224_86130688.pth
+[2023-03-09 17:05:17,293][744402] Updated weights for policy 0, policy_version 168880 (0.0005)
+[2023-03-09 17:05:18,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9705.4). Total num frames: 86482944. Throughput: 0: 9991.3. Samples: 86482912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:18,995][744089] Avg episode reward: [(0, '501.721')]
+[2023-03-09 17:05:21,510][744402] Updated weights for policy 0, policy_version 168960 (0.0005)
+[2023-03-09 17:05:23,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9705.4). Total num frames: 86532096. Throughput: 0: 9945.6. Samples: 86511448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:23,996][744089] Avg episode reward: [(0, '504.406')]
+[2023-03-09 17:05:25,485][744402] Updated weights for policy 0, policy_version 169040 (0.0005)
+[2023-03-09 17:05:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9705.4). Total num frames: 86581248. Throughput: 0: 10014.8. Samples: 86571712. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:28,995][744089] Avg episode reward: [(0, '545.201')]
+[2023-03-09 17:05:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000169104_86581248.pth...
+[2023-03-09 17:05:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000168528_86286336.pth
+[2023-03-09 17:05:29,498][744402] Updated weights for policy 0, policy_version 169120 (0.0005)
+[2023-03-09 17:05:33,611][744402] Updated weights for policy 0, policy_version 169200 (0.0005)
+[2023-03-09 17:05:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9719.3). Total num frames: 86630400. Throughput: 0: 10056.8. Samples: 86632468. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:33,995][744089] Avg episode reward: [(0, '525.646')]
+[2023-03-09 17:05:37,954][744402] Updated weights for policy 0, policy_version 169280 (0.0004)
+[2023-03-09 17:05:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9719.3). Total num frames: 86679552. Throughput: 0: 10016.5. Samples: 86660884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:38,995][744089] Avg episode reward: [(0, '546.960')]
+[2023-03-09 17:05:42,019][744402] Updated weights for policy 0, policy_version 169360 (0.0005)
+[2023-03-09 17:05:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9719.3). Total num frames: 86728704. Throughput: 0: 9914.5. Samples: 86720176. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:43,995][744089] Avg episode reward: [(0, '543.191')]
+[2023-03-09 17:05:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000169392_86728704.pth...
+[2023-03-09 17:05:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000168816_86433792.pth
+[2023-03-09 17:05:46,263][744402] Updated weights for policy 0, policy_version 169440 (0.0005)
+[2023-03-09 17:05:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9966.9, 300 sec: 9719.3). Total num frames: 86777856. Throughput: 0: 9877.2. Samples: 86778256. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:48,995][744089] Avg episode reward: [(0, '546.707')]
+[2023-03-09 17:05:50,318][744402] Updated weights for policy 0, policy_version 169520 (0.0005)
+[2023-03-09 17:05:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9719.3). Total num frames: 86827008. Throughput: 0: 9943.5. Samples: 86807968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:05:53,995][744089] Avg episode reward: [(0, '573.387')]
+[2023-03-09 17:05:54,608][744402] Updated weights for policy 0, policy_version 169600 (0.0005)
+[2023-03-09 17:05:58,857][744402] Updated weights for policy 0, policy_version 169680 (0.0005)
+[2023-03-09 17:05:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9733.2). Total num frames: 86876160. Throughput: 0: 9867.0. Samples: 86865584. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:05:58,996][744089] Avg episode reward: [(0, '556.099')]
+[2023-03-09 17:05:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000169680_86876160.pth...
+[2023-03-09 17:05:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000169104_86581248.pth
+[2023-03-09 17:06:03,281][744402] Updated weights for policy 0, policy_version 169760 (0.0005)
+[2023-03-09 17:06:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9719.3). Total num frames: 86921216. Throughput: 0: 9742.3. Samples: 86921316. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:03,995][744089] Avg episode reward: [(0, '562.914')]
+[2023-03-09 17:06:07,478][744402] Updated weights for policy 0, policy_version 169840 (0.0005)
+[2023-03-09 17:06:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 86970368. Throughput: 0: 9772.2. Samples: 86951196. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:08,995][744089] Avg episode reward: [(0, '548.129')]
+[2023-03-09 17:06:11,794][744402] Updated weights for policy 0, policy_version 169920 (0.0005)
+[2023-03-09 17:06:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 87019520. Throughput: 0: 9726.6. Samples: 87009408. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:13,996][744089] Avg episode reward: [(0, '539.741')]
+[2023-03-09 17:06:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000169960_87019520.pth...
+[2023-03-09 17:06:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000169392_86728704.pth
+[2023-03-09 17:06:15,839][744402] Updated weights for policy 0, policy_version 170000 (0.0005)
+[2023-03-09 17:06:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 87068672. Throughput: 0: 9717.3. Samples: 87069748. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:18,995][744089] Avg episode reward: [(0, '549.638')]
+[2023-03-09 17:06:19,950][744402] Updated weights for policy 0, policy_version 170080 (0.0005)
+[2023-03-09 17:06:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 87117824. Throughput: 0: 9700.5. Samples: 87097408. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:23,996][744089] Avg episode reward: [(0, '547.179')]
+[2023-03-09 17:06:24,259][744402] Updated weights for policy 0, policy_version 170160 (0.0005)
+[2023-03-09 17:06:28,426][744402] Updated weights for policy 0, policy_version 170240 (0.0005)
+[2023-03-09 17:06:28,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 87166976. Throughput: 0: 9702.0. Samples: 87156768. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:28,996][744089] Avg episode reward: [(0, '546.879')]
+[2023-03-09 17:06:29,001][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000170248_87166976.pth...
+[2023-03-09 17:06:29,004][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000169680_86876160.pth
+[2023-03-09 17:06:32,690][744402] Updated weights for policy 0, policy_version 170320 (0.0005)
+[2023-03-09 17:06:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 87212032. Throughput: 0: 9694.4. Samples: 87214504. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:33,995][744089] Avg episode reward: [(0, '542.032')]
+[2023-03-09 17:06:36,905][744402] Updated weights for policy 0, policy_version 170400 (0.0005)
+[2023-03-09 17:06:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 87261184. Throughput: 0: 9705.1. Samples: 87244696. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:38,996][744089] Avg episode reward: [(0, '541.021')]
+[2023-03-09 17:06:41,430][744402] Updated weights for policy 0, policy_version 170480 (0.0005)
+[2023-03-09 17:06:43,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9693.8, 300 sec: 9733.2). Total num frames: 87310336. Throughput: 0: 9649.7. Samples: 87299820. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:43,996][744089] Avg episode reward: [(0, '518.468')]
+[2023-03-09 17:06:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000170528_87310336.pth...
+[2023-03-09 17:06:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000169960_87019520.pth
+[2023-03-09 17:06:45,583][744402] Updated weights for policy 0, policy_version 170560 (0.0005)
+[2023-03-09 17:06:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 87355392. Throughput: 0: 9697.2. Samples: 87357688. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:48,995][744089] Avg episode reward: [(0, '555.760')]
+[2023-03-09 17:06:49,938][744402] Updated weights for policy 0, policy_version 170640 (0.0005)
+[2023-03-09 17:06:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9705.4). Total num frames: 87404544. Throughput: 0: 9672.7. Samples: 87386468. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:53,995][744089] Avg episode reward: [(0, '557.644')]
+[2023-03-09 17:06:54,181][744402] Updated weights for policy 0, policy_version 170720 (0.0005)
+[2023-03-09 17:06:58,354][744402] Updated weights for policy 0, policy_version 170800 (0.0005)
+[2023-03-09 17:06:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 87453696. Throughput: 0: 9687.8. Samples: 87445356. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:06:58,995][744089] Avg episode reward: [(0, '553.536')]
+[2023-03-09 17:06:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000170808_87453696.pth...
+[2023-03-09 17:06:58,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000170248_87166976.pth
+[2023-03-09 17:07:02,560][744402] Updated weights for policy 0, policy_version 170880 (0.0006)
+[2023-03-09 17:07:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 87502848. Throughput: 0: 9620.3. Samples: 87502664. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:03,995][744089] Avg episode reward: [(0, '558.021')]
+[2023-03-09 17:07:06,678][744402] Updated weights for policy 0, policy_version 170960 (0.0005)
+[2023-03-09 17:07:08,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 87556096. Throughput: 0: 9673.3. Samples: 87532708. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:08,995][744089] Avg episode reward: [(0, '547.736')]
+[2023-03-09 17:07:10,863][744402] Updated weights for policy 0, policy_version 171040 (0.0005)
+[2023-03-09 17:07:13,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 87601152. Throughput: 0: 9680.0. Samples: 87592368. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:13,995][744089] Avg episode reward: [(0, '551.931')]
+[2023-03-09 17:07:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000171096_87601152.pth...
+[2023-03-09 17:07:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000170528_87310336.pth
+[2023-03-09 17:07:15,061][744402] Updated weights for policy 0, policy_version 171120 (0.0005)
+[2023-03-09 17:07:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 87650304. Throughput: 0: 9684.4. Samples: 87650304. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:18,995][744089] Avg episode reward: [(0, '554.340')]
+[2023-03-09 17:07:19,167][744402] Updated weights for policy 0, policy_version 171200 (0.0005)
+[2023-03-09 17:07:23,070][744402] Updated weights for policy 0, policy_version 171280 (0.0005)
+[2023-03-09 17:07:23,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9762.2, 300 sec: 9747.1). Total num frames: 87703552. Throughput: 0: 9725.7. Samples: 87682352. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:23,995][744089] Avg episode reward: [(0, '556.726')]
+[2023-03-09 17:07:27,196][744402] Updated weights for policy 0, policy_version 171360 (0.0005)
+[2023-03-09 17:07:28,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.2, 300 sec: 9747.1). Total num frames: 87752704. Throughput: 0: 9835.1. Samples: 87742400. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:28,996][744089] Avg episode reward: [(0, '537.965')]
+[2023-03-09 17:07:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000171392_87752704.pth...
+[2023-03-09 17:07:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000170808_87453696.pth
+[2023-03-09 17:07:31,446][744402] Updated weights for policy 0, policy_version 171440 (0.0006)
+[2023-03-09 17:07:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 87801856. Throughput: 0: 9829.3. Samples: 87800008. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:33,995][744089] Avg episode reward: [(0, '529.602')]
+[2023-03-09 17:07:35,710][744402] Updated weights for policy 0, policy_version 171520 (0.0005)
+[2023-03-09 17:07:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 87846912. Throughput: 0: 9836.4. Samples: 87829104. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:38,995][744089] Avg episode reward: [(0, '525.455')]
+[2023-03-09 17:07:39,880][744402] Updated weights for policy 0, policy_version 171600 (0.0005)
+[2023-03-09 17:07:43,970][744402] Updated weights for policy 0, policy_version 171680 (0.0005)
+[2023-03-09 17:07:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 87900160. Throughput: 0: 9833.5. Samples: 87887864. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:43,995][744089] Avg episode reward: [(0, '542.885')]
+[2023-03-09 17:07:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000171680_87900160.pth...
+[2023-03-09 17:07:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000171096_87601152.pth
+[2023-03-09 17:07:48,251][744402] Updated weights for policy 0, policy_version 171760 (0.0004)
+[2023-03-09 17:07:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 87945216. Throughput: 0: 9853.4. Samples: 87946068. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:49,006][744089] Avg episode reward: [(0, '536.774')]
+[2023-03-09 17:07:52,451][744402] Updated weights for policy 0, policy_version 171840 (0.0004)
+[2023-03-09 17:07:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 87994368. Throughput: 0: 9849.4. Samples: 87975932. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:53,996][744089] Avg episode reward: [(0, '527.280')]
+[2023-03-09 17:07:56,639][744402] Updated weights for policy 0, policy_version 171920 (0.0004)
+[2023-03-09 17:07:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 88043520. Throughput: 0: 9839.8. Samples: 88035160. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:07:58,995][744089] Avg episode reward: [(0, '547.177')]
+[2023-03-09 17:07:59,009][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000171960_88043520.pth...
+[2023-03-09 17:07:59,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000171392_87752704.pth
+[2023-03-09 17:08:00,710][744402] Updated weights for policy 0, policy_version 172000 (0.0005)
+[2023-03-09 17:08:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 88092672. Throughput: 0: 9866.1. Samples: 88094276. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:03,995][744089] Avg episode reward: [(0, '539.303')]
+[2023-03-09 17:08:04,894][744402] Updated weights for policy 0, policy_version 172080 (0.0004)
+[2023-03-09 17:08:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 88141824. Throughput: 0: 9797.2. Samples: 88123224. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:08,995][744089] Avg episode reward: [(0, '480.307')]
+[2023-03-09 17:08:09,086][744402] Updated weights for policy 0, policy_version 172160 (0.0005)
+[2023-03-09 17:08:13,177][744402] Updated weights for policy 0, policy_version 172240 (0.0005)
+[2023-03-09 17:08:13,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9898.7, 300 sec: 9761.0). Total num frames: 88195072. Throughput: 0: 9793.4. Samples: 88183104. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:13,996][744089] Avg episode reward: [(0, '517.613')]
+[2023-03-09 17:08:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000172256_88195072.pth...
+[2023-03-09 17:08:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000171680_87900160.pth
+[2023-03-09 17:08:17,495][744402] Updated weights for policy 0, policy_version 172320 (0.0005)
+[2023-03-09 17:08:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 88240128. Throughput: 0: 9797.9. Samples: 88240912. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:18,995][744089] Avg episode reward: [(0, '534.651')]
+[2023-03-09 17:08:21,824][744402] Updated weights for policy 0, policy_version 172400 (0.0005)
+[2023-03-09 17:08:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9762.1, 300 sec: 9761.0). Total num frames: 88289280. Throughput: 0: 9771.0. Samples: 88268800. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:23,995][744089] Avg episode reward: [(0, '535.301')]
+[2023-03-09 17:08:25,973][744402] Updated weights for policy 0, policy_version 172480 (0.0005)
+[2023-03-09 17:08:28,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9762.1, 300 sec: 9761.0). Total num frames: 88338432. Throughput: 0: 9764.2. Samples: 88327256. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:28,996][744089] Avg episode reward: [(0, '461.825')]
+[2023-03-09 17:08:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000172536_88338432.pth...
+[2023-03-09 17:08:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000171960_88043520.pth
+[2023-03-09 17:08:30,371][744402] Updated weights for policy 0, policy_version 172560 (0.0005)
+[2023-03-09 17:08:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9747.1). Total num frames: 88383488. Throughput: 0: 9734.9. Samples: 88384140. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:33,995][744089] Avg episode reward: [(0, '504.391')]
+[2023-03-09 17:08:34,606][744402] Updated weights for policy 0, policy_version 172640 (0.0005)
+[2023-03-09 17:08:38,852][744402] Updated weights for policy 0, policy_version 172720 (0.0005)
+[2023-03-09 17:08:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 88432640. Throughput: 0: 9709.2. Samples: 88412844. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:38,996][744089] Avg episode reward: [(0, '499.850')]
+[2023-03-09 17:08:43,091][744402] Updated weights for policy 0, policy_version 172800 (0.0005)
+[2023-03-09 17:08:43,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9747.1). Total num frames: 88477696. Throughput: 0: 9689.8. Samples: 88471200. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:43,996][744089] Avg episode reward: [(0, '490.325')]
+[2023-03-09 17:08:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000172816_88481792.pth...
+[2023-03-09 17:08:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000172256_88195072.pth
+[2023-03-09 17:08:47,307][744402] Updated weights for policy 0, policy_version 172880 (0.0005)
+[2023-03-09 17:08:48,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9761.0). Total num frames: 88530944. Throughput: 0: 9687.9. Samples: 88530232. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:48,995][744089] Avg episode reward: [(0, '510.101')]
+[2023-03-09 17:08:51,311][744402] Updated weights for policy 0, policy_version 172960 (0.0005)
+[2023-03-09 17:08:53,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9774.9). Total num frames: 88580096. Throughput: 0: 9707.4. Samples: 88560060. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:53,996][744089] Avg episode reward: [(0, '534.914')]
+[2023-03-09 17:08:55,573][744402] Updated weights for policy 0, policy_version 173040 (0.0005)
+[2023-03-09 17:08:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9788.7). Total num frames: 88629248. Throughput: 0: 9699.0. Samples: 88619560. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:08:58,996][744089] Avg episode reward: [(0, '532.543')]
+[2023-03-09 17:08:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000173104_88629248.pth...
+[2023-03-09 17:08:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000172536_88338432.pth
+[2023-03-09 17:08:59,692][744402] Updated weights for policy 0, policy_version 173120 (0.0005)
+[2023-03-09 17:09:03,835][744402] Updated weights for policy 0, policy_version 173200 (0.0005)
+[2023-03-09 17:09:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9788.7). Total num frames: 88678400. Throughput: 0: 9722.4. Samples: 88678420. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:09:03,995][744089] Avg episode reward: [(0, '522.692')]
+[2023-03-09 17:09:07,983][744402] Updated weights for policy 0, policy_version 173280 (0.0006)
+[2023-03-09 17:09:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 88727552. Throughput: 0: 9743.7. Samples: 88707268. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:09:08,995][744089] Avg episode reward: [(0, '530.474')]
+[2023-03-09 17:09:12,130][744402] Updated weights for policy 0, policy_version 173360 (0.0005)
+[2023-03-09 17:09:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9802.6). Total num frames: 88776704. Throughput: 0: 9781.8. Samples: 88767436. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:13,995][744089] Avg episode reward: [(0, '509.685')]
+[2023-03-09 17:09:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000173392_88776704.pth...
+[2023-03-09 17:09:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000172816_88481792.pth
+[2023-03-09 17:09:16,400][744402] Updated weights for policy 0, policy_version 173440 (0.0005)
+[2023-03-09 17:09:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 88825856. Throughput: 0: 9802.5. Samples: 88825252. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:18,996][744089] Avg episode reward: [(0, '547.071')]
+[2023-03-09 17:09:20,631][744402] Updated weights for policy 0, policy_version 173520 (0.0005)
+[2023-03-09 17:09:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 88875008. Throughput: 0: 9795.8. Samples: 88853656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:23,996][744089] Avg episode reward: [(0, '520.129')]
+[2023-03-09 17:09:24,754][744402] Updated weights for policy 0, policy_version 173600 (0.0005)
+[2023-03-09 17:09:28,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 88920064. Throughput: 0: 9792.3. Samples: 88911852. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:28,996][744089] Avg episode reward: [(0, '553.628')]
+[2023-03-09 17:09:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000173672_88920064.pth...
+[2023-03-09 17:09:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000173104_88629248.pth
+[2023-03-09 17:09:29,145][744402] Updated weights for policy 0, policy_version 173680 (0.0004)
+[2023-03-09 17:09:33,417][744402] Updated weights for policy 0, policy_version 173760 (0.0005)
+[2023-03-09 17:09:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9788.7). Total num frames: 88969216. Throughput: 0: 9753.9. Samples: 88969160. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:33,996][744089] Avg episode reward: [(0, '557.151')]
+[2023-03-09 17:09:37,593][744402] Updated weights for policy 0, policy_version 173840 (0.0005)
+[2023-03-09 17:09:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9788.7). Total num frames: 89018368. Throughput: 0: 9733.9. Samples: 88998084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:38,995][744089] Avg episode reward: [(0, '528.168')]
+[2023-03-09 17:09:41,920][744402] Updated weights for policy 0, policy_version 173920 (0.0005)
+[2023-03-09 17:09:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9788.7). Total num frames: 89067520. Throughput: 0: 9688.2. Samples: 89055528. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:43,996][744089] Avg episode reward: [(0, '554.109')]
+[2023-03-09 17:09:44,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000173960_89067520.pth...
+[2023-03-09 17:09:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000173392_88776704.pth
+[2023-03-09 17:09:46,244][744402] Updated weights for policy 0, policy_version 174000 (0.0005)
+[2023-03-09 17:09:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9774.9). Total num frames: 89112576. Throughput: 0: 9657.9. Samples: 89113024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:48,995][744089] Avg episode reward: [(0, '499.602')]
+[2023-03-09 17:09:50,449][744402] Updated weights for policy 0, policy_version 174080 (0.0005)
+[2023-03-09 17:09:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 89161728. Throughput: 0: 9645.6. Samples: 89141320. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:53,995][744089] Avg episode reward: [(0, '472.295')]
+[2023-03-09 17:09:54,718][744402] Updated weights for policy 0, policy_version 174160 (0.0005)
+[2023-03-09 17:09:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9747.1). Total num frames: 89206784. Throughput: 0: 9585.1. Samples: 89198764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:09:58,995][744089] Avg episode reward: [(0, '533.725')]
+[2023-03-09 17:09:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000174232_89206784.pth...
+[2023-03-09 17:09:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000173672_88920064.pth
+[2023-03-09 17:09:59,050][744402] Updated weights for policy 0, policy_version 174240 (0.0005)
+[2023-03-09 17:10:03,348][744402] Updated weights for policy 0, policy_version 174320 (0.0005)
+[2023-03-09 17:10:03,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9747.1). Total num frames: 89255936. Throughput: 0: 9584.5. Samples: 89256552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:03,995][744089] Avg episode reward: [(0, '501.846')]
+[2023-03-09 17:10:07,430][744402] Updated weights for policy 0, policy_version 174400 (0.0005)
+[2023-03-09 17:10:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9747.1). Total num frames: 89305088. Throughput: 0: 9630.8. Samples: 89287040. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:08,995][744089] Avg episode reward: [(0, '521.565')]
+[2023-03-09 17:10:11,953][744402] Updated weights for policy 0, policy_version 174480 (0.0005)
+[2023-03-09 17:10:13,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 89354240. Throughput: 0: 9558.0. Samples: 89341960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:13,996][744089] Avg episode reward: [(0, '518.633')]
+[2023-03-09 17:10:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000174520_89354240.pth...
+[2023-03-09 17:10:14,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000173960_89067520.pth
+[2023-03-09 17:10:16,102][744402] Updated weights for policy 0, policy_version 174560 (0.0005)
+[2023-03-09 17:10:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.4, 300 sec: 9719.3). Total num frames: 89399296. Throughput: 0: 9626.8. Samples: 89402364. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:18,995][744089] Avg episode reward: [(0, '527.033')]
+[2023-03-09 17:10:20,203][744402] Updated weights for policy 0, policy_version 174640 (0.0005)
+[2023-03-09 17:10:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 89452544. Throughput: 0: 9645.4. Samples: 89432128. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:23,995][744089] Avg episode reward: [(0, '552.881')]
+[2023-03-09 17:10:24,409][744402] Updated weights for policy 0, policy_version 174720 (0.0005)
+[2023-03-09 17:10:28,637][744402] Updated weights for policy 0, policy_version 174800 (0.0005)
+[2023-03-09 17:10:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 89497600. Throughput: 0: 9649.8. Samples: 89489768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:28,995][744089] Avg episode reward: [(0, '528.744')]
+[2023-03-09 17:10:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000174800_89497600.pth...
+[2023-03-09 17:10:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000174232_89206784.pth
+[2023-03-09 17:10:32,717][744402] Updated weights for policy 0, policy_version 174880 (0.0004)
+[2023-03-09 17:10:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 89546752. Throughput: 0: 9680.8. Samples: 89548660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:33,995][744089] Avg episode reward: [(0, '531.245')]
+[2023-03-09 17:10:36,962][744402] Updated weights for policy 0, policy_version 174960 (0.0005)
+[2023-03-09 17:10:38,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 89600000. Throughput: 0: 9708.4. Samples: 89578196. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:38,995][744089] Avg episode reward: [(0, '524.830')]
+[2023-03-09 17:10:41,090][744402] Updated weights for policy 0, policy_version 175040 (0.0005)
+[2023-03-09 17:10:43,995][744089] Fps is (10 sec: 10239.8, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 89649152. Throughput: 0: 9746.4. Samples: 89637352. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:43,996][744089] Avg episode reward: [(0, '548.020')]
+[2023-03-09 17:10:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000175096_89649152.pth...
+[2023-03-09 17:10:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000174520_89354240.pth
+[2023-03-09 17:10:45,191][744402] Updated weights for policy 0, policy_version 175120 (0.0005)
+[2023-03-09 17:10:48,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 89694208. Throughput: 0: 9776.7. Samples: 89696504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:48,995][744089] Avg episode reward: [(0, '537.074')]
+[2023-03-09 17:10:49,498][744402] Updated weights for policy 0, policy_version 175200 (0.0005)
+[2023-03-09 17:10:53,600][744402] Updated weights for policy 0, policy_version 175280 (0.0005)
+[2023-03-09 17:10:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 89743360. Throughput: 0: 9720.5. Samples: 89724460. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:53,995][744089] Avg episode reward: [(0, '510.006')]
+[2023-03-09 17:10:57,731][744402] Updated weights for policy 0, policy_version 175360 (0.0005)
+[2023-03-09 17:10:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 89792512. Throughput: 0: 9841.6. Samples: 89784832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:10:58,996][744089] Avg episode reward: [(0, '542.985')]
+[2023-03-09 17:10:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000175376_89792512.pth...
+[2023-03-09 17:10:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000174800_89497600.pth
+[2023-03-09 17:11:02,095][744402] Updated weights for policy 0, policy_version 175440 (0.0004)
+[2023-03-09 17:11:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 89841664. Throughput: 0: 9755.7. Samples: 89841372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:03,996][744089] Avg episode reward: [(0, '537.978')]
+[2023-03-09 17:11:06,400][744402] Updated weights for policy 0, policy_version 175520 (0.0005)
+[2023-03-09 17:11:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 89890816. Throughput: 0: 9749.3. Samples: 89870848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:08,996][744089] Avg episode reward: [(0, '521.130')]
+[2023-03-09 17:11:10,587][744402] Updated weights for policy 0, policy_version 175600 (0.0005)
+[2023-03-09 17:11:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 89935872. Throughput: 0: 9730.0. Samples: 89927620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:13,996][744089] Avg episode reward: [(0, '520.175')]
+[2023-03-09 17:11:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000175656_89935872.pth...
+[2023-03-09 17:11:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000175096_89649152.pth
+[2023-03-09 17:11:14,932][744402] Updated weights for policy 0, policy_version 175680 (0.0004)
+[2023-03-09 17:11:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9719.3). Total num frames: 89985024. Throughput: 0: 9725.2. Samples: 89986296. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:18,995][744089] Avg episode reward: [(0, '532.064')]
+[2023-03-09 17:11:19,126][744402] Updated weights for policy 0, policy_version 175760 (0.0006)
+[2023-03-09 17:11:23,432][744402] Updated weights for policy 0, policy_version 175840 (0.0005)
+[2023-03-09 17:11:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 90034176. Throughput: 0: 9704.9. Samples: 90014916. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:23,995][744089] Avg episode reward: [(0, '536.351')]
+[2023-03-09 17:11:27,747][744402] Updated weights for policy 0, policy_version 175920 (0.0005)
+[2023-03-09 17:11:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 90083328. Throughput: 0: 9644.8. Samples: 90071368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:28,996][744089] Avg episode reward: [(0, '529.956')]
+[2023-03-09 17:11:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000175944_90083328.pth...
+[2023-03-09 17:11:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000175376_89792512.pth
+[2023-03-09 17:11:31,565][744402] Updated weights for policy 0, policy_version 176000 (0.0005)
+[2023-03-09 17:11:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 90132480. Throughput: 0: 9689.8. Samples: 90132544. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:33,995][744089] Avg episode reward: [(0, '523.647')]
+[2023-03-09 17:11:36,024][744402] Updated weights for policy 0, policy_version 176080 (0.0004)
+[2023-03-09 17:11:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 90177536. Throughput: 0: 9690.3. Samples: 90160524. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:38,995][744089] Avg episode reward: [(0, '497.137')]
+[2023-03-09 17:11:40,168][744402] Updated weights for policy 0, policy_version 176160 (0.0005)
+[2023-03-09 17:11:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9747.1). Total num frames: 90230784. Throughput: 0: 9665.5. Samples: 90219780. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:43,996][744089] Avg episode reward: [(0, '519.555')]
+[2023-03-09 17:11:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000176232_90230784.pth...
+[2023-03-09 17:11:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000175656_89935872.pth
+[2023-03-09 17:11:44,315][744402] Updated weights for policy 0, policy_version 176240 (0.0005)
+[2023-03-09 17:11:48,521][744402] Updated weights for policy 0, policy_version 176320 (0.0004)
+[2023-03-09 17:11:48,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 90279936. Throughput: 0: 9736.3. Samples: 90279504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:48,996][744089] Avg episode reward: [(0, '514.056')]
+[2023-03-09 17:11:52,665][744402] Updated weights for policy 0, policy_version 176400 (0.0005)
+[2023-03-09 17:11:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 90329088. Throughput: 0: 9728.3. Samples: 90308620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:53,995][744089] Avg episode reward: [(0, '523.506')]
+[2023-03-09 17:11:56,827][744402] Updated weights for policy 0, policy_version 176480 (0.0004)
+[2023-03-09 17:11:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 90378240. Throughput: 0: 9784.2. Samples: 90367908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:11:58,995][744089] Avg episode reward: [(0, '511.662')]
+[2023-03-09 17:11:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000176520_90378240.pth...
+[2023-03-09 17:11:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000175944_90083328.pth
+[2023-03-09 17:12:00,952][744402] Updated weights for policy 0, policy_version 176560 (0.0005)
+[2023-03-09 17:12:03,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.2, 300 sec: 9733.2). Total num frames: 90427392. Throughput: 0: 9798.2. Samples: 90427216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:03,995][744089] Avg episode reward: [(0, '508.745')]
+[2023-03-09 17:12:05,145][744402] Updated weights for policy 0, policy_version 176640 (0.0005)
+[2023-03-09 17:12:08,888][744402] Updated weights for policy 0, policy_version 176720 (0.0005)
+[2023-03-09 17:12:08,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 90480640. Throughput: 0: 9865.3. Samples: 90458856. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:08,995][744089] Avg episode reward: [(0, '539.987')]
+[2023-03-09 17:12:13,309][744402] Updated weights for policy 0, policy_version 176800 (0.0005)
+[2023-03-09 17:12:13,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 90525696. Throughput: 0: 9914.1. Samples: 90517504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:13,996][744089] Avg episode reward: [(0, '539.878')]
+[2023-03-09 17:12:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000176808_90525696.pth...
+[2023-03-09 17:12:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000176232_90230784.pth
+[2023-03-09 17:12:17,601][744402] Updated weights for policy 0, policy_version 176880 (0.0005)
+[2023-03-09 17:12:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9747.1). Total num frames: 90578944. Throughput: 0: 9887.0. Samples: 90577460. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:18,995][744089] Avg episode reward: [(0, '509.118')]
+[2023-03-09 17:12:21,551][744402] Updated weights for policy 0, policy_version 176960 (0.0005)
+[2023-03-09 17:12:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 90624000. Throughput: 0: 9916.7. Samples: 90606776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:23,995][744089] Avg episode reward: [(0, '504.760')]
+[2023-03-09 17:12:25,806][744402] Updated weights for policy 0, policy_version 177040 (0.0005)
+[2023-03-09 17:12:28,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 90673152. Throughput: 0: 9893.1. Samples: 90664968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:28,995][744089] Avg episode reward: [(0, '513.210')]
+[2023-03-09 17:12:28,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000177096_90673152.pth...
+[2023-03-09 17:12:28,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000176520_90378240.pth
+[2023-03-09 17:12:29,919][744402] Updated weights for policy 0, policy_version 177120 (0.0005)
+[2023-03-09 17:12:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 90722304. Throughput: 0: 9863.7. Samples: 90723368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:33,995][744089] Avg episode reward: [(0, '528.096')]
+[2023-03-09 17:12:34,098][744402] Updated weights for policy 0, policy_version 177200 (0.0005)
+[2023-03-09 17:12:38,231][744402] Updated weights for policy 0, policy_version 177280 (0.0005)
+[2023-03-09 17:12:38,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9898.6, 300 sec: 9733.2). Total num frames: 90771456. Throughput: 0: 9889.8. Samples: 90753660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:38,996][744089] Avg episode reward: [(0, '524.978')]
+[2023-03-09 17:12:42,345][744402] Updated weights for policy 0, policy_version 177360 (0.0005)
+[2023-03-09 17:12:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 90820608. Throughput: 0: 9879.4. Samples: 90812480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:43,995][744089] Avg episode reward: [(0, '499.602')]
+[2023-03-09 17:12:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000177384_90820608.pth...
+[2023-03-09 17:12:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000176808_90525696.pth
+[2023-03-09 17:12:46,493][744402] Updated weights for policy 0, policy_version 177440 (0.0006)
+[2023-03-09 17:12:48,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9761.0). Total num frames: 90873856. Throughput: 0: 9917.7. Samples: 90873516. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:48,996][744089] Avg episode reward: [(0, '490.729')]
+[2023-03-09 17:12:50,774][744402] Updated weights for policy 0, policy_version 177520 (0.0005)
+[2023-03-09 17:12:53,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 90914816. Throughput: 0: 9783.7. Samples: 90899120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:53,995][744089] Avg episode reward: [(0, '509.781')]
+[2023-03-09 17:12:55,327][744402] Updated weights for policy 0, policy_version 177600 (0.0006)
+[2023-03-09 17:12:58,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 90963968. Throughput: 0: 9751.1. Samples: 90956304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:12:58,995][744089] Avg episode reward: [(0, '519.171')]
+[2023-03-09 17:12:59,017][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000177672_90968064.pth...
+[2023-03-09 17:12:59,018][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000177096_90673152.pth
+[2023-03-09 17:12:59,461][744402] Updated weights for policy 0, policy_version 177680 (0.0005)
+[2023-03-09 17:13:03,660][744402] Updated weights for policy 0, policy_version 177760 (0.0005)
+[2023-03-09 17:13:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 91013120. Throughput: 0: 9718.1. Samples: 91014772. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:03,995][744089] Avg episode reward: [(0, '508.664')]
+[2023-03-09 17:13:07,693][744402] Updated weights for policy 0, policy_version 177840 (0.0005)
+[2023-03-09 17:13:08,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 91066368. Throughput: 0: 9758.0. Samples: 91045888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:08,995][744089] Avg episode reward: [(0, '514.753')]
+[2023-03-09 17:13:11,705][744402] Updated weights for policy 0, policy_version 177920 (0.0005)
+[2023-03-09 17:13:13,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 91115520. Throughput: 0: 9796.3. Samples: 91105804. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:13,996][744089] Avg episode reward: [(0, '493.747')]
+[2023-03-09 17:13:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000177960_91115520.pth...
+[2023-03-09 17:13:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000177384_90820608.pth
+[2023-03-09 17:13:15,823][744402] Updated weights for policy 0, policy_version 178000 (0.0005)
+[2023-03-09 17:13:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 91164672. Throughput: 0: 9806.9. Samples: 91164680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:18,996][744089] Avg episode reward: [(0, '519.368')]
+[2023-03-09 17:13:20,197][744402] Updated weights for policy 0, policy_version 178080 (0.0005)
+[2023-03-09 17:13:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 91209728. Throughput: 0: 9766.8. Samples: 91193164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:23,995][744089] Avg episode reward: [(0, '506.981')]
+[2023-03-09 17:13:24,608][744402] Updated weights for policy 0, policy_version 178160 (0.0006)
+[2023-03-09 17:13:28,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9693.8, 300 sec: 9733.2). Total num frames: 91254784. Throughput: 0: 9668.6. Samples: 91247568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:28,995][744089] Avg episode reward: [(0, '493.764')]
+[2023-03-09 17:13:29,008][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000178240_91258880.pth...
+[2023-03-09 17:13:29,009][744402] Updated weights for policy 0, policy_version 178240 (0.0005)
+[2023-03-09 17:13:29,010][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000177672_90968064.pth
+[2023-03-09 17:13:33,153][744402] Updated weights for policy 0, policy_version 178320 (0.0004)
+[2023-03-09 17:13:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 91308032. Throughput: 0: 9626.9. Samples: 91306728. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:33,995][744089] Avg episode reward: [(0, '525.941')]
+[2023-03-09 17:13:37,361][744402] Updated weights for policy 0, policy_version 178400 (0.0005)
+[2023-03-09 17:13:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9747.1). Total num frames: 91353088. Throughput: 0: 9703.5. Samples: 91335776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:38,995][744089] Avg episode reward: [(0, '511.984')]
+[2023-03-09 17:13:41,523][744402] Updated weights for policy 0, policy_version 178480 (0.0005)
+[2023-03-09 17:13:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 91406336. Throughput: 0: 9758.7. Samples: 91395448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:43,996][744089] Avg episode reward: [(0, '506.058')]
+[2023-03-09 17:13:44,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000178528_91406336.pth...
+[2023-03-09 17:13:44,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000177960_91115520.pth
+[2023-03-09 17:13:45,646][744402] Updated weights for policy 0, policy_version 178560 (0.0005)
+[2023-03-09 17:13:48,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9693.9, 300 sec: 9747.1). Total num frames: 91455488. Throughput: 0: 9789.6. Samples: 91455304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:48,995][744089] Avg episode reward: [(0, '524.458')]
+[2023-03-09 17:13:49,777][744402] Updated weights for policy 0, policy_version 178640 (0.0005)
+[2023-03-09 17:13:53,885][744402] Updated weights for policy 0, policy_version 178720 (0.0005)
+[2023-03-09 17:13:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 91504640. Throughput: 0: 9777.3. Samples: 91485868. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:53,996][744089] Avg episode reward: [(0, '512.309')]
+[2023-03-09 17:13:58,168][744402] Updated weights for policy 0, policy_version 178800 (0.0005)
+[2023-03-09 17:13:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 91553792. Throughput: 0: 9695.3. Samples: 91542092. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:13:58,996][744089] Avg episode reward: [(0, '528.477')]
+[2023-03-09 17:13:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000178816_91553792.pth...
+[2023-03-09 17:13:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000178240_91258880.pth
+[2023-03-09 17:14:02,294][744402] Updated weights for policy 0, policy_version 178880 (0.0005)
+[2023-03-09 17:14:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 91598848. Throughput: 0: 9696.7. Samples: 91601032. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:14:03,995][744089] Avg episode reward: [(0, '509.711')]
+[2023-03-09 17:14:06,488][744402] Updated weights for policy 0, policy_version 178960 (0.0005)
+[2023-03-09 17:14:08,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 91652096. Throughput: 0: 9743.4. Samples: 91631616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:14:08,995][744089] Avg episode reward: [(0, '517.312')]
+[2023-03-09 17:14:10,255][744402] Updated weights for policy 0, policy_version 179040 (0.0005)
+[2023-03-09 17:14:13,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 91701248. Throughput: 0: 9899.7. Samples: 91693056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:14:13,996][744089] Avg episode reward: [(0, '531.693')]
+[2023-03-09 17:14:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000179104_91701248.pth...
+[2023-03-09 17:14:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000178528_91406336.pth
+[2023-03-09 17:14:14,480][744402] Updated weights for policy 0, policy_version 179120 (0.0005)
+[2023-03-09 17:14:18,489][744402] Updated weights for policy 0, policy_version 179200 (0.0006)
+[2023-03-09 17:14:18,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 91754496. Throughput: 0: 9943.9. Samples: 91754204. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:14:18,995][744089] Avg episode reward: [(0, '517.873')]
+[2023-03-09 17:14:22,682][744402] Updated weights for policy 0, policy_version 179280 (0.0006)
+[2023-03-09 17:14:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 91799552. Throughput: 0: 9939.4. Samples: 91783048. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:14:23,995][744089] Avg episode reward: [(0, '505.466')]
+[2023-03-09 17:14:26,766][744402] Updated weights for policy 0, policy_version 179360 (0.0004)
+[2023-03-09 17:14:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9966.9, 300 sec: 9774.9). Total num frames: 91852800. Throughput: 0: 9924.7. Samples: 91842060. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:14:28,995][744089] Avg episode reward: [(0, '505.175')]
+[2023-03-09 17:14:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000179400_91852800.pth...
+[2023-03-09 17:14:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000178816_91553792.pth
+[2023-03-09 17:14:30,881][744402] Updated weights for policy 0, policy_version 179440 (0.0005)
+[2023-03-09 17:14:33,995][744089] Fps is (10 sec: 10649.6, 60 sec: 9966.9, 300 sec: 9788.7). Total num frames: 91906048. Throughput: 0: 10001.2. Samples: 91905356. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:14:33,995][744089] Avg episode reward: [(0, '471.408')]
+[2023-03-09 17:14:34,878][744402] Updated weights for policy 0, policy_version 179520 (0.0005)
+[2023-03-09 17:14:38,948][744402] Updated weights for policy 0, policy_version 179600 (0.0005)
+[2023-03-09 17:14:38,995][744089] Fps is (10 sec: 10240.1, 60 sec: 10035.2, 300 sec: 9788.8). Total num frames: 91955200. Throughput: 0: 9966.1. Samples: 91934344. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:14:38,995][744089] Avg episode reward: [(0, '477.149')]
+[2023-03-09 17:14:43,235][744402] Updated weights for policy 0, policy_version 179680 (0.0005)
+[2023-03-09 17:14:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9898.7, 300 sec: 9788.7). Total num frames: 92000256. Throughput: 0: 10001.0. Samples: 91992136. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:14:43,995][744089] Avg episode reward: [(0, '506.560')]
+[2023-03-09 17:14:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000179688_92000256.pth...
+[2023-03-09 17:14:44,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000179104_91701248.pth
+[2023-03-09 17:14:47,601][744402] Updated weights for policy 0, policy_version 179760 (0.0005)
+[2023-03-09 17:14:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9898.7, 300 sec: 9788.7). Total num frames: 92049408. Throughput: 0: 9950.3. Samples: 92048796. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:14:49,006][744089] Avg episode reward: [(0, '525.437')]
+[2023-03-09 17:14:51,813][744402] Updated weights for policy 0, policy_version 179840 (0.0005)
+[2023-03-09 17:14:53,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9802.6). Total num frames: 92098560. Throughput: 0: 9921.7. Samples: 92078092. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:14:53,995][744089] Avg episode reward: [(0, '503.493')]
+[2023-03-09 17:14:56,079][744402] Updated weights for policy 0, policy_version 179920 (0.0004)
+[2023-03-09 17:14:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9802.6). Total num frames: 92147712. Throughput: 0: 9830.4. Samples: 92135424. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:14:58,995][744089] Avg episode reward: [(0, '500.246')]
+[2023-03-09 17:14:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000179976_92147712.pth...
+[2023-03-09 17:14:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000179400_91852800.pth
+[2023-03-09 17:15:00,120][744402] Updated weights for policy 0, policy_version 180000 (0.0005)
+[2023-03-09 17:15:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9802.6). Total num frames: 92196864. Throughput: 0: 9838.3. Samples: 92196928. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:15:03,995][744089] Avg episode reward: [(0, '506.691')]
+[2023-03-09 17:15:04,232][744402] Updated weights for policy 0, policy_version 180080 (0.0005)
+[2023-03-09 17:15:08,433][744402] Updated weights for policy 0, policy_version 180160 (0.0005)
+[2023-03-09 17:15:08,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9802.6). Total num frames: 92246016. Throughput: 0: 9834.5. Samples: 92225600. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:15:08,996][744089] Avg episode reward: [(0, '488.697')]
+[2023-03-09 17:15:12,717][744402] Updated weights for policy 0, policy_version 180240 (0.0005)
+[2023-03-09 17:15:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9802.6). Total num frames: 92291072. Throughput: 0: 9810.8. Samples: 92283548. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:15:13,996][744089] Avg episode reward: [(0, '513.797')]
+[2023-03-09 17:15:14,014][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000180264_92295168.pth...
+[2023-03-09 17:15:14,015][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000179688_92000256.pth
+[2023-03-09 17:15:16,702][744402] Updated weights for policy 0, policy_version 180320 (0.0004)
+[2023-03-09 17:15:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9802.6). Total num frames: 92344320. Throughput: 0: 9756.3. Samples: 92344392. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:15:18,996][744089] Avg episode reward: [(0, '488.683')]
+[2023-03-09 17:15:20,808][744402] Updated weights for policy 0, policy_version 180400 (0.0004)
+[2023-03-09 17:15:23,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9816.5). Total num frames: 92393472. Throughput: 0: 9770.6. Samples: 92374020. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:15:23,996][744089] Avg episode reward: [(0, '492.213')]
+[2023-03-09 17:15:25,055][744402] Updated weights for policy 0, policy_version 180480 (0.0004)
+[2023-03-09 17:15:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9816.5). Total num frames: 92442624. Throughput: 0: 9769.2. Samples: 92431752. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:15:28,996][744089] Avg episode reward: [(0, '478.979')]
+[2023-03-09 17:15:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000180552_92442624.pth...
+[2023-03-09 17:15:29,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000179976_92147712.pth
+[2023-03-09 17:15:29,453][744402] Updated weights for policy 0, policy_version 180560 (0.0005)
+[2023-03-09 17:15:33,794][744402] Updated weights for policy 0, policy_version 180640 (0.0005)
+[2023-03-09 17:15:33,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 92487680. Throughput: 0: 9754.4. Samples: 92487744. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:15:33,996][744089] Avg episode reward: [(0, '472.843')]
+[2023-03-09 17:15:37,644][744402] Updated weights for policy 0, policy_version 180720 (0.0005)
+[2023-03-09 17:15:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 92540928. Throughput: 0: 9830.3. Samples: 92520456. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-03-09 17:15:38,995][744089] Avg episode reward: [(0, '425.598')]
+[2023-03-09 17:15:41,385][744402] Updated weights for policy 0, policy_version 180800 (0.0004)
+[2023-03-09 17:15:43,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9816.5). Total num frames: 92590080. Throughput: 0: 9940.0. Samples: 92582724. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:15:43,995][744089] Avg episode reward: [(0, '444.008')]
+[2023-03-09 17:15:44,017][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000180848_92594176.pth...
+[2023-03-09 17:15:44,019][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000180264_92295168.pth
+[2023-03-09 17:15:45,705][744402] Updated weights for policy 0, policy_version 180880 (0.0005)
+[2023-03-09 17:15:48,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9816.5). Total num frames: 92639232. Throughput: 0: 9853.3. Samples: 92640324. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:15:48,995][744089] Avg episode reward: [(0, '448.910')]
+[2023-03-09 17:15:50,030][744402] Updated weights for policy 0, policy_version 180960 (0.0005)
+[2023-03-09 17:15:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9816.5). Total num frames: 92688384. Throughput: 0: 9830.4. Samples: 92667968. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:15:53,995][744089] Avg episode reward: [(0, '478.883')]
+[2023-03-09 17:15:54,297][744402] Updated weights for policy 0, policy_version 181040 (0.0005)
+[2023-03-09 17:15:58,735][744402] Updated weights for policy 0, policy_version 181120 (0.0005)
+[2023-03-09 17:15:58,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 92733440. Throughput: 0: 9811.4. Samples: 92725060. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:15:58,996][744089] Avg episode reward: [(0, '460.499')]
+[2023-03-09 17:15:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000181120_92733440.pth...
+[2023-03-09 17:15:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000180552_92442624.pth
+[2023-03-09 17:16:02,913][744402] Updated weights for policy 0, policy_version 181200 (0.0005)
+[2023-03-09 17:16:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 92782592. Throughput: 0: 9744.9. Samples: 92782912. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:03,996][744089] Avg episode reward: [(0, '441.655')]
+[2023-03-09 17:16:07,208][744402] Updated weights for policy 0, policy_version 181280 (0.0005)
+[2023-03-09 17:16:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9816.5). Total num frames: 92831744. Throughput: 0: 9722.8. Samples: 92811544. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:08,996][744089] Avg episode reward: [(0, '449.831')]
+[2023-03-09 17:16:11,606][744402] Updated weights for policy 0, policy_version 181360 (0.0006)
+[2023-03-09 17:16:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9802.6). Total num frames: 92876800. Throughput: 0: 9690.3. Samples: 92867816. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:13,996][744089] Avg episode reward: [(0, '465.208')]
+[2023-03-09 17:16:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000181400_92876800.pth...
+[2023-03-09 17:16:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000180848_92594176.pth
+[2023-03-09 17:16:15,750][744402] Updated weights for policy 0, policy_version 181440 (0.0005)
+[2023-03-09 17:16:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9802.6). Total num frames: 92925952. Throughput: 0: 9739.6. Samples: 92926024. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:18,995][744089] Avg episode reward: [(0, '472.626')]
+[2023-03-09 17:16:20,063][744402] Updated weights for policy 0, policy_version 181520 (0.0005)
+[2023-03-09 17:16:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9802.6). Total num frames: 92975104. Throughput: 0: 9658.0. Samples: 92955068. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:23,995][744089] Avg episode reward: [(0, '456.091')]
+[2023-03-09 17:16:24,204][744402] Updated weights for policy 0, policy_version 181600 (0.0005)
+[2023-03-09 17:16:28,083][744402] Updated weights for policy 0, policy_version 181680 (0.0005)
+[2023-03-09 17:16:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9802.6). Total num frames: 93024256. Throughput: 0: 9658.7. Samples: 93017368. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:28,995][744089] Avg episode reward: [(0, '448.364')]
+[2023-03-09 17:16:29,022][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000181696_93028352.pth...
+[2023-03-09 17:16:29,024][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000181120_92733440.pth
+[2023-03-09 17:16:32,359][744402] Updated weights for policy 0, policy_version 181760 (0.0005)
+[2023-03-09 17:16:33,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9816.5). Total num frames: 93073408. Throughput: 0: 9650.2. Samples: 93074584. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:33,995][744089] Avg episode reward: [(0, '438.243')]
+[2023-03-09 17:16:36,742][744402] Updated weights for policy 0, policy_version 181840 (0.0005)
+[2023-03-09 17:16:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9788.7). Total num frames: 93118464. Throughput: 0: 9654.8. Samples: 93102432. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:38,995][744089] Avg episode reward: [(0, '474.227')]
+[2023-03-09 17:16:41,197][744402] Updated weights for policy 0, policy_version 181920 (0.0005)
+[2023-03-09 17:16:43,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9788.8). Total num frames: 93167616. Throughput: 0: 9652.9. Samples: 93159440. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:16:43,995][744089] Avg episode reward: [(0, '491.862')]
+[2023-03-09 17:16:44,036][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000181976_93171712.pth...
+[2023-03-09 17:16:44,037][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000181400_92876800.pth
+[2023-03-09 17:16:45,422][744402] Updated weights for policy 0, policy_version 182000 (0.0005)
+[2023-03-09 17:16:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9788.7). Total num frames: 93216768. Throughput: 0: 9642.9. Samples: 93216840. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:16:48,995][744089] Avg episode reward: [(0, '475.096')]
+[2023-03-09 17:16:49,618][744402] Updated weights for policy 0, policy_version 182080 (0.0006)
+[2023-03-09 17:16:53,587][744402] Updated weights for policy 0, policy_version 182160 (0.0005)
+[2023-03-09 17:16:53,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9788.7). Total num frames: 93265920. Throughput: 0: 9709.4. Samples: 93248468. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:16:53,995][744089] Avg episode reward: [(0, '457.962')]
+[2023-03-09 17:16:57,914][744402] Updated weights for policy 0, policy_version 182240 (0.0005)
+[2023-03-09 17:16:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 93315072. Throughput: 0: 9730.3. Samples: 93305680. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:16:58,995][744089] Avg episode reward: [(0, '485.545')]
+[2023-03-09 17:16:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000182256_93315072.pth...
+[2023-03-09 17:16:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000181696_93028352.pth
+[2023-03-09 17:17:02,058][744402] Updated weights for policy 0, policy_version 182320 (0.0005)
+[2023-03-09 17:17:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9774.9). Total num frames: 93364224. Throughput: 0: 9737.9. Samples: 93364228. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:03,996][744089] Avg episode reward: [(0, '494.234')]
+[2023-03-09 17:17:06,493][744402] Updated weights for policy 0, policy_version 182400 (0.0005)
+[2023-03-09 17:17:08,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9774.9). Total num frames: 93409280. Throughput: 0: 9720.4. Samples: 93392488. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:08,996][744089] Avg episode reward: [(0, '472.571')]
+[2023-03-09 17:17:10,849][744402] Updated weights for policy 0, policy_version 182480 (0.0006)
+[2023-03-09 17:17:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 93458432. Throughput: 0: 9601.6. Samples: 93449440. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:13,996][744089] Avg episode reward: [(0, '467.323')]
+[2023-03-09 17:17:14,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000182536_93458432.pth...
+[2023-03-09 17:17:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000181976_93171712.pth
+[2023-03-09 17:17:15,015][744402] Updated weights for policy 0, policy_version 182560 (0.0006)
+[2023-03-09 17:17:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9761.0). Total num frames: 93503488. Throughput: 0: 9569.7. Samples: 93505220. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:18,995][744089] Avg episode reward: [(0, '449.564')]
+[2023-03-09 17:17:19,509][744402] Updated weights for policy 0, policy_version 182640 (0.0005)
+[2023-03-09 17:17:23,859][744402] Updated weights for policy 0, policy_version 182720 (0.0006)
+[2023-03-09 17:17:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9761.0). Total num frames: 93552640. Throughput: 0: 9558.3. Samples: 93532556. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:23,996][744089] Avg episode reward: [(0, '445.270')]
+[2023-03-09 17:17:28,144][744402] Updated weights for policy 0, policy_version 182800 (0.0005)
+[2023-03-09 17:17:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9747.1). Total num frames: 93597696. Throughput: 0: 9574.6. Samples: 93590300. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:28,996][744089] Avg episode reward: [(0, '474.529')]
+[2023-03-09 17:17:29,014][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000182816_93601792.pth...
+[2023-03-09 17:17:29,016][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000182256_93315072.pth
+[2023-03-09 17:17:32,466][744402] Updated weights for policy 0, policy_version 182880 (0.0005)
+[2023-03-09 17:17:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9747.1). Total num frames: 93646848. Throughput: 0: 9594.9. Samples: 93648612. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:34,006][744089] Avg episode reward: [(0, '496.208')]
+[2023-03-09 17:17:36,773][744402] Updated weights for policy 0, policy_version 182960 (0.0005)
+[2023-03-09 17:17:38,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9747.1). Total num frames: 93696000. Throughput: 0: 9491.7. Samples: 93675592. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:38,995][744089] Avg episode reward: [(0, '494.132')]
+[2023-03-09 17:17:40,595][744402] Updated weights for policy 0, policy_version 183040 (0.0005)
+[2023-03-09 17:17:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 93745152. Throughput: 0: 9585.6. Samples: 93737032. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:43,996][744089] Avg episode reward: [(0, '475.344')]
+[2023-03-09 17:17:44,022][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000183104_93749248.pth...
+[2023-03-09 17:17:44,024][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000182536_93458432.pth
+[2023-03-09 17:17:44,849][744402] Updated weights for policy 0, policy_version 183120 (0.0005)
+[2023-03-09 17:17:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9761.0). Total num frames: 93794304. Throughput: 0: 9562.0. Samples: 93794516. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-03-09 17:17:48,996][744089] Avg episode reward: [(0, '497.700')]
+[2023-03-09 17:17:49,177][744402] Updated weights for policy 0, policy_version 183200 (0.0006)
+[2023-03-09 17:17:53,145][744402] Updated weights for policy 0, policy_version 183280 (0.0005)
+[2023-03-09 17:17:53,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9774.9). Total num frames: 93847552. Throughput: 0: 9607.0. Samples: 93824804. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:17:53,995][744089] Avg episode reward: [(0, '461.578')]
+[2023-03-09 17:17:57,207][744402] Updated weights for policy 0, policy_version 183360 (0.0005)
+[2023-03-09 17:17:58,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9774.9). Total num frames: 93896704. Throughput: 0: 9699.3. Samples: 93885908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:17:58,996][744089] Avg episode reward: [(0, '494.443')]
+[2023-03-09 17:17:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000183392_93896704.pth...
+[2023-03-09 17:17:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000182816_93601792.pth
+[2023-03-09 17:18:01,743][744402] Updated weights for policy 0, policy_version 183440 (0.0005)
+[2023-03-09 17:18:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9747.1). Total num frames: 93941760. Throughput: 0: 9699.2. Samples: 93941684. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:03,996][744089] Avg episode reward: [(0, '501.917')]
+[2023-03-09 17:18:06,169][744402] Updated weights for policy 0, policy_version 183520 (0.0006)
+[2023-03-09 17:18:08,995][744089] Fps is (10 sec: 9011.3, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 93986816. Throughput: 0: 9675.6. Samples: 93967956. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:08,995][744089] Avg episode reward: [(0, '467.918')]
+[2023-03-09 17:18:10,528][744402] Updated weights for policy 0, policy_version 183600 (0.0005)
+[2023-03-09 17:18:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 94035968. Throughput: 0: 9660.5. Samples: 94025024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:13,996][744089] Avg episode reward: [(0, '440.558')]
+[2023-03-09 17:18:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000183664_94035968.pth...
+[2023-03-09 17:18:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000183104_93749248.pth
+[2023-03-09 17:18:14,690][744402] Updated weights for policy 0, policy_version 183680 (0.0005)
+[2023-03-09 17:18:18,817][744402] Updated weights for policy 0, policy_version 183760 (0.0005)
+[2023-03-09 17:18:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9747.1). Total num frames: 94085120. Throughput: 0: 9700.4. Samples: 94085128. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:19,006][744089] Avg episode reward: [(0, '462.359')]
+[2023-03-09 17:18:22,936][744402] Updated weights for policy 0, policy_version 183840 (0.0005)
+[2023-03-09 17:18:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9761.0). Total num frames: 94134272. Throughput: 0: 9753.2. Samples: 94114488. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:23,995][744089] Avg episode reward: [(0, '475.254')]
+[2023-03-09 17:18:27,167][744402] Updated weights for policy 0, policy_version 183920 (0.0005)
+[2023-03-09 17:18:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 94183424. Throughput: 0: 9699.2. Samples: 94173496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:29,006][744089] Avg episode reward: [(0, '441.273')]
+[2023-03-09 17:18:29,010][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000183952_94183424.pth...
+[2023-03-09 17:18:29,012][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000183392_93896704.pth
+[2023-03-09 17:18:31,641][744402] Updated weights for policy 0, policy_version 184000 (0.0005)
+[2023-03-09 17:18:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9747.1). Total num frames: 94228480. Throughput: 0: 9645.1. Samples: 94228544. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:33,996][744089] Avg episode reward: [(0, '433.137')]
+[2023-03-09 17:18:35,884][744402] Updated weights for policy 0, policy_version 184080 (0.0005)
+[2023-03-09 17:18:38,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 94277632. Throughput: 0: 9634.6. Samples: 94258360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:38,995][744089] Avg episode reward: [(0, '461.700')]
+[2023-03-09 17:18:40,025][744402] Updated weights for policy 0, policy_version 184160 (0.0006)
+[2023-03-09 17:18:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 94326784. Throughput: 0: 9614.9. Samples: 94318580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:43,996][744089] Avg episode reward: [(0, '420.827')]
+[2023-03-09 17:18:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000184232_94326784.pth...
+[2023-03-09 17:18:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000183664_94035968.pth
+[2023-03-09 17:18:44,202][744402] Updated weights for policy 0, policy_version 184240 (0.0005)
+[2023-03-09 17:18:48,508][744402] Updated weights for policy 0, policy_version 184320 (0.0005)
+[2023-03-09 17:18:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 94375936. Throughput: 0: 9636.9. Samples: 94375344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:48,995][744089] Avg episode reward: [(0, '383.113')]
+[2023-03-09 17:18:52,588][744402] Updated weights for policy 0, policy_version 184400 (0.0005)
+[2023-03-09 17:18:53,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 94425088. Throughput: 0: 9705.7. Samples: 94404712. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:53,995][744089] Avg episode reward: [(0, '439.072')]
+[2023-03-09 17:18:56,776][744402] Updated weights for policy 0, policy_version 184480 (0.0005)
+[2023-03-09 17:18:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9747.1). Total num frames: 94474240. Throughput: 0: 9775.1. Samples: 94464904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:18:58,995][744089] Avg episode reward: [(0, '488.748')]
+[2023-03-09 17:18:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000184520_94474240.pth...
+[2023-03-09 17:18:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000183952_94183424.pth
+[2023-03-09 17:19:00,722][744402] Updated weights for policy 0, policy_version 184560 (0.0005)
+[2023-03-09 17:19:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 94523392. Throughput: 0: 9770.1. Samples: 94524784. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:03,995][744089] Avg episode reward: [(0, '480.685')]
+[2023-03-09 17:19:04,915][744402] Updated weights for policy 0, policy_version 184640 (0.0005)
+[2023-03-09 17:19:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9733.2). Total num frames: 94572544. Throughput: 0: 9785.6. Samples: 94554840. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:08,995][744089] Avg episode reward: [(0, '474.228')]
+[2023-03-09 17:19:09,054][744402] Updated weights for policy 0, policy_version 184720 (0.0005)
+[2023-03-09 17:19:13,456][744402] Updated weights for policy 0, policy_version 184800 (0.0005)
+[2023-03-09 17:19:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9719.3). Total num frames: 94621696. Throughput: 0: 9731.5. Samples: 94611412. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:13,996][744089] Avg episode reward: [(0, '468.293')]
+[2023-03-09 17:19:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000184808_94621696.pth...
+[2023-03-09 17:19:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000184232_94326784.pth
+[2023-03-09 17:19:17,826][744402] Updated weights for policy 0, policy_version 184880 (0.0005)
+[2023-03-09 17:19:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 94666752. Throughput: 0: 9777.9. Samples: 94668548. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:18,995][744089] Avg episode reward: [(0, '486.424')]
+[2023-03-09 17:19:22,091][744402] Updated weights for policy 0, policy_version 184960 (0.0005)
+[2023-03-09 17:19:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 94715904. Throughput: 0: 9756.8. Samples: 94697416. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:23,996][744089] Avg episode reward: [(0, '452.193')]
+[2023-03-09 17:19:26,269][744402] Updated weights for policy 0, policy_version 185040 (0.0005)
+[2023-03-09 17:19:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 94765056. Throughput: 0: 9736.4. Samples: 94756716. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:28,995][744089] Avg episode reward: [(0, '479.048')]
+[2023-03-09 17:19:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000185088_94765056.pth...
+[2023-03-09 17:19:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000184520_94474240.pth
+[2023-03-09 17:19:30,476][744402] Updated weights for policy 0, policy_version 185120 (0.0005)
+[2023-03-09 17:19:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 94814208. Throughput: 0: 9751.8. Samples: 94814176. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:33,996][744089] Avg episode reward: [(0, '468.712')]
+[2023-03-09 17:19:34,614][744402] Updated weights for policy 0, policy_version 185200 (0.0005)
+[2023-03-09 17:19:38,767][744402] Updated weights for policy 0, policy_version 185280 (0.0005)
+[2023-03-09 17:19:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 94863360. Throughput: 0: 9761.0. Samples: 94843956. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:38,995][744089] Avg episode reward: [(0, '480.827')]
+[2023-03-09 17:19:43,117][744402] Updated weights for policy 0, policy_version 185360 (0.0005)
+[2023-03-09 17:19:43,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 94912512. Throughput: 0: 9695.5. Samples: 94901204. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:43,996][744089] Avg episode reward: [(0, '508.900')]
+[2023-03-09 17:19:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000185376_94912512.pth...
+[2023-03-09 17:19:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000184808_94621696.pth
+[2023-03-09 17:19:47,409][744402] Updated weights for policy 0, policy_version 185440 (0.0005)
+[2023-03-09 17:19:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 94957568. Throughput: 0: 9617.4. Samples: 94957568. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:48,995][744089] Avg episode reward: [(0, '480.460')]
+[2023-03-09 17:19:51,734][744402] Updated weights for policy 0, policy_version 185520 (0.0005)
+[2023-03-09 17:19:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 95006720. Throughput: 0: 9595.9. Samples: 94986656. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:53,995][744089] Avg episode reward: [(0, '487.973')]
+[2023-03-09 17:19:55,567][744402] Updated weights for policy 0, policy_version 185600 (0.0005)
+[2023-03-09 17:19:58,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 95059968. Throughput: 0: 9756.2. Samples: 95050440. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:19:58,996][744089] Avg episode reward: [(0, '476.636')]
+[2023-03-09 17:19:59,000][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000185664_95059968.pth...
+[2023-03-09 17:19:59,003][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000185088_94765056.pth
+[2023-03-09 17:19:59,525][744402] Updated weights for policy 0, policy_version 185680 (0.0005)
+[2023-03-09 17:20:03,468][744402] Updated weights for policy 0, policy_version 185760 (0.0005)
+[2023-03-09 17:20:03,995][744089] Fps is (10 sec: 10649.5, 60 sec: 9830.4, 300 sec: 9719.3). Total num frames: 95113216. Throughput: 0: 9875.7. Samples: 95112956. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:20:03,996][744089] Avg episode reward: [(0, '512.068')]
+[2023-03-09 17:20:07,656][744402] Updated weights for policy 0, policy_version 185840 (0.0005)
+[2023-03-09 17:20:08,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9733.2). Total num frames: 95162368. Throughput: 0: 9863.1. Samples: 95141256. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:08,996][744089] Avg episode reward: [(0, '499.759')]
+[2023-03-09 17:20:11,862][744402] Updated weights for policy 0, policy_version 185920 (0.0006)
+[2023-03-09 17:20:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9719.3). Total num frames: 95211520. Throughput: 0: 9905.9. Samples: 95202484. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:13,995][744089] Avg episode reward: [(0, '510.443')]
+[2023-03-09 17:20:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000185960_95211520.pth...
+[2023-03-09 17:20:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000185376_94912512.pth
+[2023-03-09 17:20:16,074][744402] Updated weights for policy 0, policy_version 186000 (0.0005)
+[2023-03-09 17:20:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9719.3). Total num frames: 95260672. Throughput: 0: 9925.9. Samples: 95260840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:18,996][744089] Avg episode reward: [(0, '494.089')]
+[2023-03-09 17:20:19,949][744402] Updated weights for policy 0, policy_version 186080 (0.0005)
+[2023-03-09 17:20:23,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9719.3). Total num frames: 95309824. Throughput: 0: 9956.8. Samples: 95292012. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:23,996][744089] Avg episode reward: [(0, '501.979')]
+[2023-03-09 17:20:24,179][744402] Updated weights for policy 0, policy_version 186160 (0.0005)
+[2023-03-09 17:20:28,340][744402] Updated weights for policy 0, policy_version 186240 (0.0005)
+[2023-03-09 17:20:28,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9733.2). Total num frames: 95358976. Throughput: 0: 9985.8. Samples: 95350564. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:28,995][744089] Avg episode reward: [(0, '513.228')]
+[2023-03-09 17:20:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000186248_95358976.pth...
+[2023-03-09 17:20:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000185664_95059968.pth
+[2023-03-09 17:20:32,541][744402] Updated weights for policy 0, policy_version 186320 (0.0005)
+[2023-03-09 17:20:33,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9719.3). Total num frames: 95408128. Throughput: 0: 10014.0. Samples: 95408200. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:33,996][744089] Avg episode reward: [(0, '487.547')]
+[2023-03-09 17:20:36,501][744402] Updated weights for policy 0, policy_version 186400 (0.0006)
+[2023-03-09 17:20:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9719.3). Total num frames: 95457280. Throughput: 0: 10079.5. Samples: 95440232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:38,995][744089] Avg episode reward: [(0, '448.247')]
+[2023-03-09 17:20:40,749][744402] Updated weights for policy 0, policy_version 186480 (0.0005)
+[2023-03-09 17:20:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9719.3). Total num frames: 95506432. Throughput: 0: 9950.6. Samples: 95498216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:43,995][744089] Avg episode reward: [(0, '483.178')]
+[2023-03-09 17:20:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000186536_95506432.pth...
+[2023-03-09 17:20:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000185960_95211520.pth
+[2023-03-09 17:20:44,946][744402] Updated weights for policy 0, policy_version 186560 (0.0005)
+[2023-03-09 17:20:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9966.9, 300 sec: 9719.3). Total num frames: 95555584. Throughput: 0: 9837.6. Samples: 95555648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:48,996][744089] Avg episode reward: [(0, '434.155')]
+[2023-03-09 17:20:49,255][744402] Updated weights for policy 0, policy_version 186640 (0.0005)
+[2023-03-09 17:20:53,073][744402] Updated weights for policy 0, policy_version 186720 (0.0005)
+[2023-03-09 17:20:53,995][744089] Fps is (10 sec: 10240.0, 60 sec: 10035.2, 300 sec: 9747.1). Total num frames: 95608832. Throughput: 0: 9891.6. Samples: 95586380. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:53,996][744089] Avg episode reward: [(0, '478.496')]
+[2023-03-09 17:20:57,235][744402] Updated weights for policy 0, policy_version 186800 (0.0005)
+[2023-03-09 17:20:58,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9747.1). Total num frames: 95657984. Throughput: 0: 9903.1. Samples: 95648124. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:20:58,996][744089] Avg episode reward: [(0, '494.580')]
+[2023-03-09 17:20:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000186832_95657984.pth...
+[2023-03-09 17:20:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000186248_95358976.pth
+[2023-03-09 17:21:01,463][744402] Updated weights for policy 0, policy_version 186880 (0.0005)
+[2023-03-09 17:21:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9747.1). Total num frames: 95707136. Throughput: 0: 9917.0. Samples: 95707104. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:03,995][744089] Avg episode reward: [(0, '495.417')]
+[2023-03-09 17:21:05,621][744402] Updated weights for policy 0, policy_version 186960 (0.0005)
+[2023-03-09 17:21:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9830.4, 300 sec: 9747.1). Total num frames: 95752192. Throughput: 0: 9861.1. Samples: 95735760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:08,995][744089] Avg episode reward: [(0, '513.586')]
+[2023-03-09 17:21:09,807][744402] Updated weights for policy 0, policy_version 187040 (0.0005)
+[2023-03-09 17:21:13,882][744402] Updated weights for policy 0, policy_version 187120 (0.0005)
+[2023-03-09 17:21:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9761.0). Total num frames: 95805440. Throughput: 0: 9872.4. Samples: 95794824. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:13,996][744089] Avg episode reward: [(0, '490.459')]
+[2023-03-09 17:21:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000187120_95805440.pth...
+[2023-03-09 17:21:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000186536_95506432.pth
+[2023-03-09 17:21:17,967][744402] Updated weights for policy 0, policy_version 187200 (0.0005)
+[2023-03-09 17:21:18,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9898.7, 300 sec: 9761.0). Total num frames: 95854592. Throughput: 0: 9920.3. Samples: 95854612. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:18,996][744089] Avg episode reward: [(0, '506.696')]
+[2023-03-09 17:21:22,052][744402] Updated weights for policy 0, policy_version 187280 (0.0005)
+[2023-03-09 17:21:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9898.7, 300 sec: 9761.0). Total num frames: 95903744. Throughput: 0: 9882.2. Samples: 95884932. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:23,995][744089] Avg episode reward: [(0, '517.262')]
+[2023-03-09 17:21:26,182][744402] Updated weights for policy 0, policy_version 187360 (0.0004)
+[2023-03-09 17:21:28,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9774.9). Total num frames: 95956992. Throughput: 0: 9922.3. Samples: 95944720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:28,996][744089] Avg episode reward: [(0, '508.974')]
+[2023-03-09 17:21:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000187416_95956992.pth...
+[2023-03-09 17:21:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000186832_95657984.pth
+[2023-03-09 17:21:30,165][744402] Updated weights for policy 0, policy_version 187440 (0.0005)
+[2023-03-09 17:21:33,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9898.7, 300 sec: 9774.9). Total num frames: 96002048. Throughput: 0: 9958.9. Samples: 96003796. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:33,995][744089] Avg episode reward: [(0, '493.992')]
+[2023-03-09 17:21:34,576][744402] Updated weights for policy 0, policy_version 187520 (0.0006)
+[2023-03-09 17:21:38,815][744402] Updated weights for policy 0, policy_version 187600 (0.0006)
+[2023-03-09 17:21:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9898.7, 300 sec: 9774.9). Total num frames: 96051200. Throughput: 0: 9891.4. Samples: 96031492. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:38,995][744089] Avg episode reward: [(0, '494.402')]
+[2023-03-09 17:21:42,916][744402] Updated weights for policy 0, policy_version 187680 (0.0005)
+[2023-03-09 17:21:43,995][744089] Fps is (10 sec: 9830.2, 60 sec: 9898.7, 300 sec: 9774.9). Total num frames: 96100352. Throughput: 0: 9860.4. Samples: 96091840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:43,996][744089] Avg episode reward: [(0, '502.273')]
+[2023-03-09 17:21:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000187696_96100352.pth...
+[2023-03-09 17:21:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000187120_95805440.pth
+[2023-03-09 17:21:46,931][744402] Updated weights for policy 0, policy_version 187760 (0.0005)
+[2023-03-09 17:21:48,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9788.7). Total num frames: 96153600. Throughput: 0: 9891.5. Samples: 96152220. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:48,996][744089] Avg episode reward: [(0, '510.725')]
+[2023-03-09 17:21:50,788][744402] Updated weights for policy 0, policy_version 187840 (0.0004)
+[2023-03-09 17:21:53,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9898.7, 300 sec: 9788.7). Total num frames: 96202752. Throughput: 0: 9990.6. Samples: 96185336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:53,995][744089] Avg episode reward: [(0, '503.867')]
+[2023-03-09 17:21:54,938][744402] Updated weights for policy 0, policy_version 187920 (0.0005)
+[2023-03-09 17:21:58,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9898.7, 300 sec: 9788.7). Total num frames: 96251904. Throughput: 0: 9938.8. Samples: 96242068. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:21:58,995][744089] Avg episode reward: [(0, '516.378')]
+[2023-03-09 17:21:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000187992_96251904.pth...
+[2023-03-09 17:21:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000187416_95956992.pth
+[2023-03-09 17:21:59,280][744402] Updated weights for policy 0, policy_version 188000 (0.0005)
+[2023-03-09 17:22:03,415][744402] Updated weights for policy 0, policy_version 188080 (0.0005)
+[2023-03-09 17:22:03,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9802.6). Total num frames: 96301056. Throughput: 0: 9922.4. Samples: 96301120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:22:03,995][744089] Avg episode reward: [(0, '509.740')]
+[2023-03-09 17:22:07,537][744402] Updated weights for policy 0, policy_version 188160 (0.0006)
+[2023-03-09 17:22:08,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9802.6). Total num frames: 96350208. Throughput: 0: 9886.8. Samples: 96329840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:22:08,995][744089] Avg episode reward: [(0, '493.287')]
+[2023-03-09 17:22:11,776][744402] Updated weights for policy 0, policy_version 188240 (0.0005)
+[2023-03-09 17:22:13,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9816.5). Total num frames: 96399360. Throughput: 0: 9867.5. Samples: 96388756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:22:13,996][744089] Avg episode reward: [(0, '522.385')]
+[2023-03-09 17:22:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000188280_96399360.pth...
+[2023-03-09 17:22:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000187696_96100352.pth
+[2023-03-09 17:22:15,966][744402] Updated weights for policy 0, policy_version 188320 (0.0004)
+[2023-03-09 17:22:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9802.6). Total num frames: 96444416. Throughput: 0: 9839.7. Samples: 96446584. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:18,996][744089] Avg episode reward: [(0, '527.789')]
+[2023-03-09 17:22:20,382][744402] Updated weights for policy 0, policy_version 188400 (0.0005)
+[2023-03-09 17:22:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9816.5). Total num frames: 96493568. Throughput: 0: 9825.5. Samples: 96473640. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:23,995][744089] Avg episode reward: [(0, '532.480')]
+[2023-03-09 17:22:24,707][744402] Updated weights for policy 0, policy_version 188480 (0.0006)
+[2023-03-09 17:22:28,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9802.6). Total num frames: 96538624. Throughput: 0: 9743.8. Samples: 96530312. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:28,996][744089] Avg episode reward: [(0, '518.857')]
+[2023-03-09 17:22:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000188552_96538624.pth...
+[2023-03-09 17:22:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000187992_96251904.pth
+[2023-03-09 17:22:29,209][744402] Updated weights for policy 0, policy_version 188560 (0.0006)
+[2023-03-09 17:22:33,882][744402] Updated weights for policy 0, policy_version 188640 (0.0006)
+[2023-03-09 17:22:33,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9693.8, 300 sec: 9788.7). Total num frames: 96583680. Throughput: 0: 9582.0. Samples: 96583412. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:33,996][744089] Avg episode reward: [(0, '529.000')]
+[2023-03-09 17:22:38,101][744402] Updated weights for policy 0, policy_version 188720 (0.0005)
+[2023-03-09 17:22:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 96632832. Throughput: 0: 9490.8. Samples: 96612424. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:38,996][744089] Avg episode reward: [(0, '488.459')]
+[2023-03-09 17:22:42,253][744402] Updated weights for policy 0, policy_version 188800 (0.0005)
+[2023-03-09 17:22:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9788.7). Total num frames: 96681984. Throughput: 0: 9528.6. Samples: 96670856. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:43,996][744089] Avg episode reward: [(0, '505.130')]
+[2023-03-09 17:22:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000188832_96681984.pth...
+[2023-03-09 17:22:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000188280_96399360.pth
+[2023-03-09 17:22:46,560][744402] Updated weights for policy 0, policy_version 188880 (0.0006)
+[2023-03-09 17:22:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9761.0). Total num frames: 96727040. Throughput: 0: 9468.9. Samples: 96727220. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:48,996][744089] Avg episode reward: [(0, '530.874')]
+[2023-03-09 17:22:50,922][744402] Updated weights for policy 0, policy_version 188960 (0.0005)
+[2023-03-09 17:22:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9761.0). Total num frames: 96776192. Throughput: 0: 9463.8. Samples: 96755712. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:53,995][744089] Avg episode reward: [(0, '505.674')]
+[2023-03-09 17:22:55,383][744402] Updated weights for policy 0, policy_version 189040 (0.0004)
+[2023-03-09 17:22:58,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9761.0). Total num frames: 96821248. Throughput: 0: 9425.6. Samples: 96812908. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:22:58,996][744089] Avg episode reward: [(0, '521.639')]
+[2023-03-09 17:22:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000189104_96821248.pth...
+[2023-03-09 17:22:59,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000188552_96538624.pth
+[2023-03-09 17:22:59,653][744402] Updated weights for policy 0, policy_version 189120 (0.0005)
+[2023-03-09 17:23:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9420.8, 300 sec: 9761.0). Total num frames: 96866304. Throughput: 0: 9393.1. Samples: 96869272. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:23:03,995][744089] Avg episode reward: [(0, '484.500')]
+[2023-03-09 17:23:04,030][744402] Updated weights for policy 0, policy_version 189200 (0.0005)
+[2023-03-09 17:23:08,500][744402] Updated weights for policy 0, policy_version 189280 (0.0005)
+[2023-03-09 17:23:08,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9420.8, 300 sec: 9761.0). Total num frames: 96915456. Throughput: 0: 9383.9. Samples: 96895916. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:23:08,995][744089] Avg episode reward: [(0, '498.024')]
+[2023-03-09 17:23:12,689][744402] Updated weights for policy 0, policy_version 189360 (0.0005)
+[2023-03-09 17:23:13,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9352.5, 300 sec: 9747.1). Total num frames: 96960512. Throughput: 0: 9400.2. Samples: 96953320. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:23:13,995][744089] Avg episode reward: [(0, '512.198')]
+[2023-03-09 17:23:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000189384_96964608.pth...
+[2023-03-09 17:23:14,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000188832_96681984.pth
+[2023-03-09 17:23:16,984][744402] Updated weights for policy 0, policy_version 189440 (0.0005)
+[2023-03-09 17:23:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9747.1). Total num frames: 97009664. Throughput: 0: 9511.8. Samples: 97011440. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:23:18,995][744089] Avg episode reward: [(0, '504.354')]
+[2023-03-09 17:23:21,227][744402] Updated weights for policy 0, policy_version 189520 (0.0005)
+[2023-03-09 17:23:23,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9420.8, 300 sec: 9747.1). Total num frames: 97058816. Throughput: 0: 9493.2. Samples: 97039616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:23:23,996][744089] Avg episode reward: [(0, '476.910')]
+[2023-03-09 17:23:25,506][744402] Updated weights for policy 0, policy_version 189600 (0.0005)
+[2023-03-09 17:23:28,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.1, 300 sec: 9761.0). Total num frames: 97107968. Throughput: 0: 9482.4. Samples: 97097564. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:23:28,995][744089] Avg episode reward: [(0, '485.701')]
+[2023-03-09 17:23:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000189664_97107968.pth...
+[2023-03-09 17:23:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000189104_96821248.pth
+[2023-03-09 17:23:29,803][744402] Updated weights for policy 0, policy_version 189680 (0.0005)
+[2023-03-09 17:23:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9747.1). Total num frames: 97153024. Throughput: 0: 9485.7. Samples: 97154076. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:23:33,995][744089] Avg episode reward: [(0, '510.843')]
+[2023-03-09 17:23:34,059][744402] Updated weights for policy 0, policy_version 189760 (0.0005)
+[2023-03-09 17:23:38,260][744402] Updated weights for policy 0, policy_version 189840 (0.0004)
+[2023-03-09 17:23:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9747.1). Total num frames: 97202176. Throughput: 0: 9513.7. Samples: 97183828. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:23:38,995][744089] Avg episode reward: [(0, '497.735')]
+[2023-03-09 17:23:42,425][744402] Updated weights for policy 0, policy_version 189920 (0.0005)
+[2023-03-09 17:23:43,995][744089] Fps is (10 sec: 9830.5, 60 sec: 9489.1, 300 sec: 9747.1). Total num frames: 97251328. Throughput: 0: 9560.8. Samples: 97243144. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:23:43,995][744089] Avg episode reward: [(0, '512.099')]
+[2023-03-09 17:23:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000189944_97251328.pth...
+[2023-03-09 17:23:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000189384_96964608.pth
+[2023-03-09 17:23:46,725][744402] Updated weights for policy 0, policy_version 190000 (0.0005)
+[2023-03-09 17:23:48,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9747.1). Total num frames: 97300480. Throughput: 0: 9580.7. Samples: 97300404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:23:48,995][744089] Avg episode reward: [(0, '514.986')]
+[2023-03-09 17:23:51,048][744402] Updated weights for policy 0, policy_version 190080 (0.0005)
+[2023-03-09 17:23:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9557.3, 300 sec: 9747.1). Total num frames: 97349632. Throughput: 0: 9627.6. Samples: 97329160. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:23:53,995][744089] Avg episode reward: [(0, '507.288')]
+[2023-03-09 17:23:55,213][744402] Updated weights for policy 0, policy_version 190160 (0.0005)
+[2023-03-09 17:23:58,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9733.2). Total num frames: 97394688. Throughput: 0: 9623.4. Samples: 97386376. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:23:58,996][744089] Avg episode reward: [(0, '509.477')]
+[2023-03-09 17:23:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000190224_97394688.pth...
+[2023-03-09 17:23:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000189664_97107968.pth
+[2023-03-09 17:23:59,674][744402] Updated weights for policy 0, policy_version 190240 (0.0005)
+[2023-03-09 17:24:03,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9557.3, 300 sec: 9719.3). Total num frames: 97439744. Throughput: 0: 9550.9. Samples: 97441232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:24:03,995][744089] Avg episode reward: [(0, '531.107')]
+[2023-03-09 17:24:04,066][744402] Updated weights for policy 0, policy_version 190320 (0.0005)
+[2023-03-09 17:24:08,236][744402] Updated weights for policy 0, policy_version 190400 (0.0005)
+[2023-03-09 17:24:08,995][744089] Fps is (10 sec: 9421.0, 60 sec: 9557.3, 300 sec: 9719.3). Total num frames: 97488896. Throughput: 0: 9589.8. Samples: 97471156. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:24:08,995][744089] Avg episode reward: [(0, '525.894')]
+[2023-03-09 17:24:12,412][744402] Updated weights for policy 0, policy_version 190480 (0.0004)
+[2023-03-09 17:24:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 97538048. Throughput: 0: 9602.2. Samples: 97529664. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:24:13,996][744089] Avg episode reward: [(0, '527.966')]
+[2023-03-09 17:24:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000190504_97538048.pth...
+[2023-03-09 17:24:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000189944_97251328.pth
+[2023-03-09 17:24:16,719][744402] Updated weights for policy 0, policy_version 190560 (0.0005)
+[2023-03-09 17:24:18,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 97587200. Throughput: 0: 9630.0. Samples: 97587428. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:24:18,996][744089] Avg episode reward: [(0, '522.050')]
+[2023-03-09 17:24:21,089][744402] Updated weights for policy 0, policy_version 190640 (0.0005)
+[2023-03-09 17:24:23,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9719.3). Total num frames: 97632256. Throughput: 0: 9594.7. Samples: 97615588. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:24:23,995][744089] Avg episode reward: [(0, '529.864')]
+[2023-03-09 17:24:25,300][744402] Updated weights for policy 0, policy_version 190720 (0.0005)
+[2023-03-09 17:24:28,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9557.3, 300 sec: 9719.3). Total num frames: 97681408. Throughput: 0: 9580.3. Samples: 97674260. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-03-09 17:24:28,995][744089] Avg episode reward: [(0, '516.005')]
+[2023-03-09 17:24:29,049][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000190792_97685504.pth...
+[2023-03-09 17:24:29,051][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000190224_97394688.pth
+[2023-03-09 17:24:29,484][744402] Updated weights for policy 0, policy_version 190800 (0.0005)
+[2023-03-09 17:24:33,685][744402] Updated weights for policy 0, policy_version 190880 (0.0005)
+[2023-03-09 17:24:33,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 97730560. Throughput: 0: 9581.5. Samples: 97731572. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:24:33,995][744089] Avg episode reward: [(0, '520.271')]
+[2023-03-09 17:24:37,832][744402] Updated weights for policy 0, policy_version 190960 (0.0005)
+[2023-03-09 17:24:38,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 97779712. Throughput: 0: 9623.9. Samples: 97762236. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:24:38,995][744089] Avg episode reward: [(0, '524.057')]
+[2023-03-09 17:24:42,132][744402] Updated weights for policy 0, policy_version 191040 (0.0005)
+[2023-03-09 17:24:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 97828864. Throughput: 0: 9626.1. Samples: 97819548. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:24:43,996][744089] Avg episode reward: [(0, '542.251')]
+[2023-03-09 17:24:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000191072_97828864.pth...
+[2023-03-09 17:24:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000190504_97538048.pth
+[2023-03-09 17:24:46,326][744402] Updated weights for policy 0, policy_version 191120 (0.0005)
+[2023-03-09 17:24:48,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9733.2). Total num frames: 97878016. Throughput: 0: 9707.9. Samples: 97878088. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:24:48,996][744089] Avg episode reward: [(0, '535.171')]
+[2023-03-09 17:24:50,506][744402] Updated weights for policy 0, policy_version 191200 (0.0005)
+[2023-03-09 17:24:53,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9719.3). Total num frames: 97927168. Throughput: 0: 9697.5. Samples: 97907544. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:24:53,995][744089] Avg episode reward: [(0, '498.977')]
+[2023-03-09 17:24:54,513][744402] Updated weights for policy 0, policy_version 191280 (0.0006)
+[2023-03-09 17:24:58,625][744402] Updated weights for policy 0, policy_version 191360 (0.0005)
+[2023-03-09 17:24:58,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9762.1, 300 sec: 9719.3). Total num frames: 97980416. Throughput: 0: 9746.8. Samples: 97968268. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:24:58,995][744089] Avg episode reward: [(0, '527.520')]
+[2023-03-09 17:24:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000191368_97980416.pth...
+[2023-03-09 17:24:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000190792_97685504.pth
+[2023-03-09 17:25:02,833][744402] Updated weights for policy 0, policy_version 191440 (0.0005)
+[2023-03-09 17:25:03,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9705.4). Total num frames: 98025472. Throughput: 0: 9734.3. Samples: 98025472. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:25:03,996][744089] Avg episode reward: [(0, '509.501')]
+[2023-03-09 17:25:07,367][744402] Updated weights for policy 0, policy_version 191520 (0.0005)
+[2023-03-09 17:25:08,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 98070528. Throughput: 0: 9742.7. Samples: 98054008. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:25:08,995][744089] Avg episode reward: [(0, '540.314')]
+[2023-03-09 17:25:11,610][744402] Updated weights for policy 0, policy_version 191600 (0.0006)
+[2023-03-09 17:25:13,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9693.9, 300 sec: 9691.6). Total num frames: 98119680. Throughput: 0: 9708.9. Samples: 98111160. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:25:13,995][744089] Avg episode reward: [(0, '529.499')]
+[2023-03-09 17:25:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000191640_98119680.pth...
+[2023-03-09 17:25:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000191072_97828864.pth
+[2023-03-09 17:25:16,040][744402] Updated weights for policy 0, policy_version 191680 (0.0005)
+[2023-03-09 17:25:18,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9677.7). Total num frames: 98164736. Throughput: 0: 9661.1. Samples: 98166320. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:25:18,995][744089] Avg episode reward: [(0, '529.669')]
+[2023-03-09 17:25:20,471][744402] Updated weights for policy 0, policy_version 191760 (0.0005)
+[2023-03-09 17:25:23,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9677.7). Total num frames: 98213888. Throughput: 0: 9594.7. Samples: 98194000. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:25:23,995][744089] Avg episode reward: [(0, '533.126')]
+[2023-03-09 17:25:24,837][744402] Updated weights for policy 0, policy_version 191840 (0.0005)
+[2023-03-09 17:25:28,995][744089] Fps is (10 sec: 9420.6, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 98258944. Throughput: 0: 9579.7. Samples: 98250636. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:25:28,996][744089] Avg episode reward: [(0, '517.006')]
+[2023-03-09 17:25:28,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000191912_98258944.pth...
+[2023-03-09 17:25:29,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000191368_97980416.pth
+[2023-03-09 17:25:29,229][744402] Updated weights for policy 0, policy_version 191920 (0.0005)
+[2023-03-09 17:25:33,437][744402] Updated weights for policy 0, policy_version 192000 (0.0005)
+[2023-03-09 17:25:33,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9663.8). Total num frames: 98308096. Throughput: 0: 9555.6. Samples: 98308092. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:25:33,995][744089] Avg episode reward: [(0, '509.730')]
+[2023-03-09 17:25:37,628][744402] Updated weights for policy 0, policy_version 192080 (0.0005)
+[2023-03-09 17:25:38,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 98353152. Throughput: 0: 9538.5. Samples: 98336776. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:25:38,995][744089] Avg episode reward: [(0, '525.046')]
+[2023-03-09 17:25:42,074][744402] Updated weights for policy 0, policy_version 192160 (0.0005)
+[2023-03-09 17:25:43,995][744089] Fps is (10 sec: 9420.7, 60 sec: 9557.3, 300 sec: 9649.9). Total num frames: 98402304. Throughput: 0: 9450.6. Samples: 98393544. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:25:43,996][744089] Avg episode reward: [(0, '536.525')]
+[2023-03-09 17:25:43,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000192192_98402304.pth...
+[2023-03-09 17:25:44,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000191640_98119680.pth
+[2023-03-09 17:25:46,509][744402] Updated weights for policy 0, policy_version 192240 (0.0005)
+[2023-03-09 17:25:48,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9622.1). Total num frames: 98447360. Throughput: 0: 9382.2. Samples: 98447672. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:25:48,995][744089] Avg episode reward: [(0, '535.669')]
+[2023-03-09 17:25:51,002][744402] Updated weights for policy 0, policy_version 192320 (0.0005)
+[2023-03-09 17:25:53,995][744089] Fps is (10 sec: 9420.9, 60 sec: 9489.1, 300 sec: 9622.1). Total num frames: 98496512. Throughput: 0: 9377.4. Samples: 98475992. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:25:53,995][744089] Avg episode reward: [(0, '504.432')]
+[2023-03-09 17:25:55,240][744402] Updated weights for policy 0, policy_version 192400 (0.0005)
+[2023-03-09 17:25:58,995][744089] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9622.1). Total num frames: 98545664. Throughput: 0: 9421.7. Samples: 98535136. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:25:58,995][744089] Avg episode reward: [(0, '526.948')]
+[2023-03-09 17:25:58,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000192472_98545664.pth...
+[2023-03-09 17:25:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000191912_98258944.pth
+[2023-03-09 17:25:59,372][744402] Updated weights for policy 0, policy_version 192480 (0.0005)
+[2023-03-09 17:26:03,649][744402] Updated weights for policy 0, policy_version 192560 (0.0005)
+[2023-03-09 17:26:03,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9420.8, 300 sec: 9622.1). Total num frames: 98590720. Throughput: 0: 9463.1. Samples: 98592160. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:26:03,995][744089] Avg episode reward: [(0, '524.799')]
+[2023-03-09 17:26:07,912][744402] Updated weights for policy 0, policy_version 192640 (0.0005)
+[2023-03-09 17:26:08,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9608.2). Total num frames: 98639872. Throughput: 0: 9525.0. Samples: 98622624. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:26:08,995][744089] Avg episode reward: [(0, '529.873')]
+[2023-03-09 17:26:11,973][744402] Updated weights for policy 0, policy_version 192720 (0.0005)
+[2023-03-09 17:26:13,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.1, 300 sec: 9608.2). Total num frames: 98689024. Throughput: 0: 9559.9. Samples: 98680832. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:26:13,995][744089] Avg episode reward: [(0, '534.234')]
+[2023-03-09 17:26:13,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000192752_98689024.pth...
+[2023-03-09 17:26:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000192192_98402304.pth
+[2023-03-09 17:26:16,515][744402] Updated weights for policy 0, policy_version 192800 (0.0005)
+[2023-03-09 17:26:18,995][744089] Fps is (10 sec: 9420.8, 60 sec: 9489.1, 300 sec: 9594.4). Total num frames: 98734080. Throughput: 0: 9464.2. Samples: 98733980. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:26:18,995][744089] Avg episode reward: [(0, '535.034')]
+[2023-03-09 17:26:21,228][744402] Updated weights for policy 0, policy_version 192880 (0.0005)
+[2023-03-09 17:26:23,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9420.8, 300 sec: 9566.6). Total num frames: 98779136. Throughput: 0: 9396.6. Samples: 98759624. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:26:23,996][744089] Avg episode reward: [(0, '532.513')]
+[2023-03-09 17:26:25,978][744402] Updated weights for policy 0, policy_version 192960 (0.0005)
+[2023-03-09 17:26:28,995][744089] Fps is (10 sec: 8601.6, 60 sec: 9352.5, 300 sec: 9552.7). Total num frames: 98820096. Throughput: 0: 9278.2. Samples: 98811064. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:26:28,995][744089] Avg episode reward: [(0, '536.217')]
+[2023-03-09 17:26:28,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000193008_98820096.pth...
+[2023-03-09 17:26:29,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000192472_98545664.pth
+[2023-03-09 17:26:30,958][744402] Updated weights for policy 0, policy_version 193040 (0.0006)
+[2023-03-09 17:26:33,995][744089] Fps is (10 sec: 8192.0, 60 sec: 9216.0, 300 sec: 9524.9). Total num frames: 98861056. Throughput: 0: 9222.8. Samples: 98862696. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:26:33,995][744089] Avg episode reward: [(0, '516.721')]
+[2023-03-09 17:26:35,352][744402] Updated weights for policy 0, policy_version 193120 (0.0005)
+[2023-03-09 17:26:38,995][744089] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 9524.9). Total num frames: 98910208. Throughput: 0: 9241.7. Samples: 98891868. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-03-09 17:26:38,996][744089] Avg episode reward: [(0, '522.399')]
+[2023-03-09 17:26:39,480][744402] Updated weights for policy 0, policy_version 193200 (0.0005)
+[2023-03-09 17:26:43,393][744402] Updated weights for policy 0, policy_version 193280 (0.0005)
+[2023-03-09 17:26:43,995][744089] Fps is (10 sec: 10239.9, 60 sec: 9352.5, 300 sec: 9524.9). Total num frames: 98963456. Throughput: 0: 9298.4. Samples: 98953564. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:26:43,995][744089] Avg episode reward: [(0, '507.920')]
+[2023-03-09 17:26:43,998][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000193288_98963456.pth...
+[2023-03-09 17:26:44,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000192752_98689024.pth
+[2023-03-09 17:26:47,305][744402] Updated weights for policy 0, policy_version 193360 (0.0005)
+[2023-03-09 17:26:48,995][744089] Fps is (10 sec: 10649.7, 60 sec: 9489.1, 300 sec: 9538.8). Total num frames: 99016704. Throughput: 0: 9434.5. Samples: 99016712. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:26:48,995][744089] Avg episode reward: [(0, '509.587')]
+[2023-03-09 17:26:51,207][744402] Updated weights for policy 0, policy_version 193440 (0.0006)
+[2023-03-09 17:26:53,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9489.1, 300 sec: 9538.8). Total num frames: 99065856. Throughput: 0: 9430.9. Samples: 99047016. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:26:53,995][744089] Avg episode reward: [(0, '511.720')]
+[2023-03-09 17:26:55,494][744402] Updated weights for policy 0, policy_version 193520 (0.0005)
+[2023-03-09 17:26:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 9489.1, 300 sec: 9538.8). Total num frames: 99115008. Throughput: 0: 9426.6. Samples: 99105028. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:26:58,996][744089] Avg episode reward: [(0, '518.779')]
+[2023-03-09 17:26:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000193584_99115008.pth...
+[2023-03-09 17:26:59,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000193008_98820096.pth
+[2023-03-09 17:26:59,723][744402] Updated weights for policy 0, policy_version 193600 (0.0005)
+[2023-03-09 17:27:03,521][744402] Updated weights for policy 0, policy_version 193680 (0.0005)
+[2023-03-09 17:27:03,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 99168256. Throughput: 0: 9643.7. Samples: 99167948. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:03,995][744089] Avg episode reward: [(0, '513.542')]
+[2023-03-09 17:27:07,355][744402] Updated weights for policy 0, policy_version 193760 (0.0004)
+[2023-03-09 17:27:08,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9625.6, 300 sec: 9552.7). Total num frames: 99217408. Throughput: 0: 9802.4. Samples: 99200732. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:08,995][744089] Avg episode reward: [(0, '529.344')]
+[2023-03-09 17:27:11,438][744402] Updated weights for policy 0, policy_version 193840 (0.0004)
+[2023-03-09 17:27:13,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9693.9, 300 sec: 9580.5). Total num frames: 99270656. Throughput: 0: 10003.2. Samples: 99261208. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:13,996][744089] Avg episode reward: [(0, '549.487')]
+[2023-03-09 17:27:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000193888_99270656.pth...
+[2023-03-09 17:27:14,001][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000193288_98963456.pth
+[2023-03-09 17:27:15,726][744402] Updated weights for policy 0, policy_version 193920 (0.0005)
+[2023-03-09 17:27:18,995][744089] Fps is (10 sec: 10240.0, 60 sec: 9762.1, 300 sec: 9580.5). Total num frames: 99319808. Throughput: 0: 10169.3. Samples: 99320316. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:18,995][744089] Avg episode reward: [(0, '513.738')]
+[2023-03-09 17:27:19,397][744402] Updated weights for policy 0, policy_version 194000 (0.0005)
+[2023-03-09 17:27:23,224][744402] Updated weights for policy 0, policy_version 194080 (0.0005)
+[2023-03-09 17:27:23,995][744089] Fps is (10 sec: 10240.1, 60 sec: 9898.7, 300 sec: 9608.2). Total num frames: 99373056. Throughput: 0: 10238.2. Samples: 99352584. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:23,995][744089] Avg episode reward: [(0, '535.637')]
+[2023-03-09 17:27:27,324][744402] Updated weights for policy 0, policy_version 194160 (0.0005)
+[2023-03-09 17:27:28,995][744089] Fps is (10 sec: 10239.9, 60 sec: 10035.2, 300 sec: 9622.1). Total num frames: 99422208. Throughput: 0: 10232.5. Samples: 99414028. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:28,996][744089] Avg episode reward: [(0, '525.344')]
+[2023-03-09 17:27:29,058][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000194192_99426304.pth...
+[2023-03-09 17:27:29,061][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000193584_99115008.pth
+[2023-03-09 17:27:31,336][744402] Updated weights for policy 0, policy_version 194240 (0.0005)
+[2023-03-09 17:27:33,995][744089] Fps is (10 sec: 10240.0, 60 sec: 10240.0, 300 sec: 9636.0). Total num frames: 99475456. Throughput: 0: 10200.7. Samples: 99475744. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:33,995][744089] Avg episode reward: [(0, '521.774')]
+[2023-03-09 17:27:35,420][744402] Updated weights for policy 0, policy_version 194320 (0.0005)
+[2023-03-09 17:27:38,995][744089] Fps is (10 sec: 10240.0, 60 sec: 10240.0, 300 sec: 9636.0). Total num frames: 99524608. Throughput: 0: 10188.3. Samples: 99505488. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:38,995][744089] Avg episode reward: [(0, '519.706')]
+[2023-03-09 17:27:39,550][744402] Updated weights for policy 0, policy_version 194400 (0.0005)
+[2023-03-09 17:27:43,671][744402] Updated weights for policy 0, policy_version 194480 (0.0005)
+[2023-03-09 17:27:43,995][744089] Fps is (10 sec: 9830.4, 60 sec: 10171.8, 300 sec: 9649.9). Total num frames: 99573760. Throughput: 0: 10228.6. Samples: 99565312. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:43,995][744089] Avg episode reward: [(0, '541.566')]
+[2023-03-09 17:27:43,997][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000194480_99573760.pth...
+[2023-03-09 17:27:43,999][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000193888_99270656.pth
+[2023-03-09 17:27:47,811][744402] Updated weights for policy 0, policy_version 194560 (0.0005)
+[2023-03-09 17:27:48,995][744089] Fps is (10 sec: 10240.0, 60 sec: 10171.7, 300 sec: 9663.8). Total num frames: 99627008. Throughput: 0: 10164.8. Samples: 99625364. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-03-09 17:27:48,995][744089] Avg episode reward: [(0, '540.481')]
+[2023-03-09 17:27:51,872][744402] Updated weights for policy 0, policy_version 194640 (0.0005)
+[2023-03-09 17:27:53,995][744089] Fps is (10 sec: 10239.9, 60 sec: 10171.7, 300 sec: 9677.7). Total num frames: 99676160. Throughput: 0: 10109.3. Samples: 99655652. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:27:53,996][744089] Avg episode reward: [(0, '526.612')]
+[2023-03-09 17:27:55,890][744402] Updated weights for policy 0, policy_version 194720 (0.0005)
+[2023-03-09 17:27:58,995][744089] Fps is (10 sec: 9830.3, 60 sec: 10171.7, 300 sec: 9691.6). Total num frames: 99725312. Throughput: 0: 10105.9. Samples: 99715972. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:27:58,996][744089] Avg episode reward: [(0, '539.581')]
+[2023-03-09 17:27:58,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000194776_99725312.pth...
+[2023-03-09 17:27:59,000][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000194192_99426304.pth
+[2023-03-09 17:28:00,111][744402] Updated weights for policy 0, policy_version 194800 (0.0005)
+[2023-03-09 17:28:03,995][744089] Fps is (10 sec: 9830.5, 60 sec: 10103.5, 300 sec: 9691.6). Total num frames: 99774464. Throughput: 0: 10111.9. Samples: 99775352. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:28:03,995][744089] Avg episode reward: [(0, '529.511')]
+[2023-03-09 17:28:04,063][744402] Updated weights for policy 0, policy_version 194880 (0.0005)
+[2023-03-09 17:28:08,035][744402] Updated weights for policy 0, policy_version 194960 (0.0005)
+[2023-03-09 17:28:08,995][744089] Fps is (10 sec: 10240.0, 60 sec: 10171.7, 300 sec: 9719.3). Total num frames: 99827712. Throughput: 0: 10127.6. Samples: 99808328. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:28:08,996][744089] Avg episode reward: [(0, '542.522')]
+[2023-03-09 17:28:12,292][744402] Updated weights for policy 0, policy_version 195040 (0.0006)
+[2023-03-09 17:28:13,995][744089] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 9719.3). Total num frames: 99876864. Throughput: 0: 10027.9. Samples: 99865284. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:28:13,996][744089] Avg episode reward: [(0, '533.326')]
+[2023-03-09 17:28:13,999][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000195072_99876864.pth...
+[2023-03-09 17:28:14,002][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000194480_99573760.pth
+[2023-03-09 17:28:16,550][744402] Updated weights for policy 0, policy_version 195120 (0.0005)
+[2023-03-09 17:28:18,995][744089] Fps is (10 sec: 9830.4, 60 sec: 10103.5, 300 sec: 9719.3). Total num frames: 99926016. Throughput: 0: 10006.0. Samples: 99926016. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:28:18,995][744089] Avg episode reward: [(0, '528.433')]
+[2023-03-09 17:28:20,592][744402] Updated weights for policy 0, policy_version 195200 (0.0005)
+[2023-03-09 17:28:23,995][744089] Fps is (10 sec: 9830.5, 60 sec: 10035.2, 300 sec: 9719.3). Total num frames: 99975168. Throughput: 0: 9982.4. Samples: 99954696. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-03-09 17:28:23,996][744089] Avg episode reward: [(0, '532.575')]
+[2023-03-09 17:28:24,734][744402] Updated weights for policy 0, policy_version 195280 (0.0005)
+[2023-03-09 17:28:27,012][744358] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000000
+[2023-03-09 17:28:27,468][744358] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000000
+[2023-03-09 17:28:27,469][744438] Stopping RolloutWorker_w4...
+[2023-03-09 17:28:27,469][744404] Stopping RolloutWorker_w1...
+[2023-03-09 17:28:27,469][744406] Stopping RolloutWorker_w3...
+[2023-03-09 17:28:27,469][744405] Stopping RolloutWorker_w2...
+[2023-03-09 17:28:27,469][744502] Stopping RolloutWorker_w6...
+[2023-03-09 17:28:27,469][744534] Stopping RolloutWorker_w7...
+[2023-03-09 17:28:27,469][744470] Stopping RolloutWorker_w5...
+[2023-03-09 17:28:27,470][744438] Loop rollout_proc4_evt_loop terminating...
+[2023-03-09 17:28:27,469][744358] Stopping Batcher_0...
+[2023-03-09 17:28:27,469][744403] Stopping RolloutWorker_w0...
+[2023-03-09 17:28:27,470][744406] Loop rollout_proc3_evt_loop terminating...
+[2023-03-09 17:28:27,470][744404] Loop rollout_proc1_evt_loop terminating...
+[2023-03-09 17:28:27,470][744502] Loop rollout_proc6_evt_loop terminating...
+[2023-03-09 17:28:27,470][744405] Loop rollout_proc2_evt_loop terminating...
+[2023-03-09 17:28:27,470][744534] Loop rollout_proc7_evt_loop terminating...
+[2023-03-09 17:28:27,469][744089] Component RolloutWorker_w4 stopped!
+[2023-03-09 17:28:27,470][744470] Loop rollout_proc5_evt_loop terminating...
+[2023-03-09 17:28:27,470][744403] Loop rollout_proc0_evt_loop terminating...
+[2023-03-09 17:28:27,470][744358] Loop batcher_evt_loop terminating...
+[2023-03-09 17:28:27,470][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000195328_100007936.pth...
+[2023-03-09 17:28:27,470][744089] Component RolloutWorker_w1 stopped!
+[2023-03-09 17:28:27,470][744089] Component RolloutWorker_w3 stopped!
+[2023-03-09 17:28:27,470][744089] Component RolloutWorker_w2 stopped!
+[2023-03-09 17:28:27,471][744089] Component RolloutWorker_w5 stopped!
+[2023-03-09 17:28:27,471][744089] Component RolloutWorker_w7 stopped!
+[2023-03-09 17:28:27,471][744089] Component RolloutWorker_w6 stopped!
+[2023-03-09 17:28:27,471][744089] Component Batcher_0 stopped!
+[2023-03-09 17:28:27,471][744089] Component RolloutWorker_w0 stopped!
+[2023-03-09 17:28:27,472][744358] Removing /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000194776_99725312.pth
+[2023-03-09 17:28:27,472][744358] Saving /home/qgallouedec/gia/data/envs/metaworld/train_dir/pick-out-of-hole-v2/checkpoint_p0/checkpoint_000195328_100007936.pth...
+[2023-03-09 17:28:27,474][744358] Stopping LearnerWorker_p0...
+[2023-03-09 17:28:27,474][744358] Loop learner_proc0_evt_loop terminating...
+[2023-03-09 17:28:27,474][744089] Component LearnerWorker_p0 stopped!
+[2023-03-09 17:28:27,537][744402] Weights refcount: 2 0
+[2023-03-09 17:28:27,538][744402] Stopping InferenceWorker_p0-w0...
+[2023-03-09 17:28:27,538][744402] Loop inference_proc0-0_evt_loop terminating...
+[2023-03-09 17:28:27,538][744089] Component InferenceWorker_p0-w0 stopped!
+[2023-03-09 17:28:27,539][744089] Waiting for process learner_proc0 to stop...
+[2023-03-09 17:28:28,042][744089] Waiting for process inference_proc0-0 to join...
+[2023-03-09 17:28:28,140][744089] Waiting for process rollout_proc0 to join...
+[2023-03-09 17:28:28,141][744089] Waiting for process rollout_proc1 to join...
+[2023-03-09 17:28:28,141][744089] Waiting for process rollout_proc2 to join...
+[2023-03-09 17:28:28,141][744089] Waiting for process rollout_proc3 to join...
+[2023-03-09 17:28:28,142][744089] Waiting for process rollout_proc4 to join...
+[2023-03-09 17:28:28,142][744089] Waiting for process rollout_proc5 to join...
+[2023-03-09 17:28:28,142][744089] Waiting for process rollout_proc6 to join...
+[2023-03-09 17:28:28,142][744089] Waiting for process rollout_proc7 to join...
+[2023-03-09 17:28:28,143][744089] Batcher 0 profile tree view:
+batching: 18.0846, releasing_batches: 15.2524
+[2023-03-09 17:28:28,143][744089] InferenceWorker_p0-w0 profile tree view:
+wait_policy: 0.0051
+  wait_policy_total: 3905.4151
+update_model: 118.5518
+  weight_update: 0.0005
+one_step: 0.0013
+  handle_policy_step: 5930.5297
+    deserialize: 249.4478, stack: 62.8469, obs_to_device_normalize: 1054.7909, forward: 2946.5436, send_messages: 455.0898
+    prepare_outputs: 638.7227
+      to_cpu: 99.1395
+[2023-03-09 17:28:28,143][744089] Learner 0 profile tree view:
+misc: 0.0972, prepare_batch: 82.2730
+train: 1061.1054
+  epoch_init: 0.3821, minibatch_init: 11.3111, losses_postprocess: 12.9455, kl_divergence: 4.1483, after_optimizer: 5.9384
+  calculate_losses: 431.4721
+    losses_init: 0.3096, forward_head: 206.8590, bptt_initial: 1.2059, bptt: 1.2511, tail: 107.1571, advantages_returns: 8.7283, losses: 92.8689
+  update: 579.9748
+    clip: 53.2355
+[2023-03-09 17:28:28,144][744089] RolloutWorker_w0 profile tree view:
+wait_for_trajectories: 4.5490, enqueue_policy_requests: 167.5792, env_step: 6279.3634, overhead: 336.6860, complete_rollouts: 3.9021
+save_policy_outputs: 378.3208
+  split_output_tensors: 185.3301
+[2023-03-09 17:28:28,144][744089] RolloutWorker_w7 profile tree view:
+wait_for_trajectories: 4.3702, enqueue_policy_requests: 163.1292, env_step: 6218.7010, overhead: 332.1245, complete_rollouts: 3.8334
+save_policy_outputs: 369.3509
+  split_output_tensors: 181.5411
+[2023-03-09 17:28:28,144][744089] Loop Runner_EvtLoop terminating...
+[2023-03-09 17:28:28,145][744089] Runner profile tree view:
+main_loop: 10691.7797
+[2023-03-09 17:28:28,145][744089] Collected {0: 100007936}, FPS: 9353.7