dat commited on
Commit
cf2304e
1 Parent(s): 95e3f9d

Saving weights and logs of step 165000

Browse files
checkpoint_165000 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1249a98181f6c88b99edd430d005ee524d792f1377b801369a13ea56ec4bffd7
3
+ size 1530270447
events.out.tfevents.1626397185.t1v-n-f5c06ea1-w-0.760449.3.v2 CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:a215185a808c330bebad4945b14953ccf9bbc8481899abf78109b6c0a0d6804b
3
- size 436270
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:394effd12a2e58d256ab80dfb0bc02c37268c5098be5d3050c5b05ce5c717c3f
3
+ size 2256324
flax_model.msgpack CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:0ec0fb67c52b43bbdf61a82273bba1919d00f297e8de79d79148b5f14a013a41
3
  size 510090043
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:fff3acc43f8a71e6b8176ce73e92121516e50ce55d7c1c1e43afc3e343513e85
3
  size 510090043
run.sh CHANGED
@@ -16,7 +16,7 @@ python ./run_mlm_flax_no_accum.py \
16
  --adam_beta2="0.98" \
17
  --logging_steps="50" \
18
  --eval_steps="6000" \
19
- --num_train_epochs="2"\
20
  --preprocessing_num_workers="96" \
21
  --save_steps="15000" \
22
  --learning_rate="3e-5" \
 
16
  --adam_beta2="0.98" \
17
  --logging_steps="50" \
18
  --eval_steps="6000" \
19
+ --num_train_epochs="3"\
20
  --preprocessing_num_workers="96" \
21
  --save_steps="15000" \
22
  --learning_rate="3e-5" \
wandb/debug-internal.log CHANGED
@@ -1 +1 @@
1
- run-20210715_185845-dq8uirtg/logs/debug-internal.log
 
1
+ run-20210716_005946-3bte92ft/logs/debug-internal.log
wandb/debug.log CHANGED
@@ -1 +1 @@
1
- run-20210715_185845-dq8uirtg/logs/debug.log
 
1
+ run-20210716_005946-3bte92ft/logs/debug.log
wandb/latest-run CHANGED
@@ -1 +1 @@
1
- run-20210715_185845-dq8uirtg
 
1
+ run-20210716_005946-3bte92ft
wandb/run-20210715_185845-dq8uirtg/files/output.log CHANGED
@@ -5735,3 +5735,13 @@ tcmalloc: large alloc 2715181056 bytes == 0x3dd038000 @ 0x7f7011c37680 0x7f7011
5735
  [00:56:49] - INFO - absl - Saved checkpoint at checkpoint_150000
5736
  [00:56:51] - INFO - huggingface_hub.repository - git version 2.25.1
5737
  git-lfs/2.9.2 (GitHub; linux amd64; go 1.13.5)
 
 
 
 
 
 
 
 
 
 
 
5735
  [00:56:49] - INFO - absl - Saved checkpoint at checkpoint_150000
5736
  [00:56:51] - INFO - huggingface_hub.repository - git version 2.25.1
5737
  git-lfs/2.9.2 (GitHub; linux amd64; go 1.13.5)
5738
+ [00:56:51] - DEBUG - huggingface_hub.repository - [Repository] is a valid git repo
5739
+ [00:57:59] - INFO - huggingface_hub.repository - Uploading LFS objects: 100% (2/2), 2.0 GB | 48 MB/s, done.
5740
+
5741
+
5742
+
5743
+ Training...: 50048it [5:53:37, 2.66it/s]
5744
+
5745
+
5746
+
5747
+
wandb/run-20210715_185845-dq8uirtg/files/wandb-summary.json CHANGED
@@ -1 +1 @@
1
- {"training_step": 150000, "learning_rate": 2.396145646343939e-05, "train_loss": 2.3190174102783203, "_runtime": 21476, "_timestamp": 1626397001, "_step": 1008, "eval_step": 150000, "eval_accuracy": 0.5905819535255432, "eval_loss": 2.15248703956604}
 
1
+ {"training_step": 150050, "learning_rate": 2.3959299142006785e-05, "train_loss": 2.5135111808776855, "_runtime": 21575, "_timestamp": 1626397100, "_step": 1009, "eval_step": 150000, "eval_accuracy": 0.5905819535255432, "eval_loss": 2.15248703956604}
wandb/run-20210715_185845-dq8uirtg/logs/debug-internal.log CHANGED
@@ -12794,3 +12794,46 @@
12794
  2021-07-16 00:56:54,268 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12795
  2021-07-16 00:57:00,563 DEBUG HandlerThread:735392 [handler.py:handle_request():124] handle_request: stop_status
12796
  2021-07-16 00:57:00,642 DEBUG SenderThread:735392 [sender.py:send_request():193] send_request: stop_status
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
12794
  2021-07-16 00:56:54,268 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12795
  2021-07-16 00:57:00,563 DEBUG HandlerThread:735392 [handler.py:handle_request():124] handle_request: stop_status
12796
  2021-07-16 00:57:00,642 DEBUG SenderThread:735392 [sender.py:send_request():193] send_request: stop_status
12797
+ 2021-07-16 00:57:10,333 DEBUG SenderThread:735392 [sender.py:send():179] send: stats
12798
+ 2021-07-16 00:57:15,776 DEBUG HandlerThread:735392 [handler.py:handle_request():124] handle_request: stop_status
12799
+ 2021-07-16 00:57:15,776 DEBUG SenderThread:735392 [sender.py:send_request():193] send_request: stop_status
12800
+ 2021-07-16 00:57:30,909 DEBUG HandlerThread:735392 [handler.py:handle_request():124] handle_request: stop_status
12801
+ 2021-07-16 00:57:30,910 DEBUG SenderThread:735392 [sender.py:send_request():193] send_request: stop_status
12802
+ 2021-07-16 00:57:40,405 DEBUG SenderThread:735392 [sender.py:send():179] send: stats
12803
+ 2021-07-16 00:57:46,048 DEBUG HandlerThread:735392 [handler.py:handle_request():124] handle_request: stop_status
12804
+ 2021-07-16 00:57:46,049 DEBUG SenderThread:735392 [sender.py:send_request():193] send_request: stop_status
12805
+ 2021-07-16 00:58:00,292 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12806
+ 2021-07-16 00:58:01,179 DEBUG HandlerThread:735392 [handler.py:handle_request():124] handle_request: stop_status
12807
+ 2021-07-16 00:58:01,180 DEBUG SenderThread:735392 [sender.py:send_request():193] send_request: stop_status
12808
+ 2021-07-16 00:58:02,293 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12809
+ 2021-07-16 00:58:04,294 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12810
+ 2021-07-16 00:58:06,294 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12811
+ 2021-07-16 00:58:08,295 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12812
+ 2021-07-16 00:58:10,475 DEBUG SenderThread:735392 [sender.py:send():179] send: stats
12813
+ 2021-07-16 00:58:16,319 DEBUG HandlerThread:735392 [handler.py:handle_request():124] handle_request: stop_status
12814
+ 2021-07-16 00:58:16,319 DEBUG SenderThread:735392 [sender.py:send_request():193] send_request: stop_status
12815
+ 2021-07-16 00:58:20,476 DEBUG SenderThread:735392 [sender.py:send():179] send: history
12816
+ 2021-07-16 00:58:20,476 DEBUG SenderThread:735392 [sender.py:send():179] send: summary
12817
+ 2021-07-16 00:58:20,478 INFO SenderThread:735392 [sender.py:_save_file():841] saving file wandb-summary.json with policy end
12818
+ 2021-07-16 00:58:21,299 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/wandb-summary.json
12819
+ 2021-07-16 00:58:21,299 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12820
+ 2021-07-16 00:58:22,299 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12821
+ 2021-07-16 00:58:24,300 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12822
+ 2021-07-16 00:58:26,301 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12823
+ 2021-07-16 00:58:28,302 INFO Thread-8 :735392 [dir_watcher.py:_on_file_modified():229] file/dir modified: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log
12824
+ 2021-07-16 00:58:28,809 WARNING MainThread:735392 [internal.py:wandb_internal():147] Internal process interrupt: 1
12825
+ 2021-07-16 00:58:29,458 WARNING MainThread:735392 [internal.py:wandb_internal():147] Internal process interrupt: 2
12826
+ 2021-07-16 00:58:29,458 ERROR MainThread:735392 [internal.py:wandb_internal():150] Internal process interrupted.
12827
+ 2021-07-16 00:58:30,202 INFO SenderThread:735392 [sender.py:finish():945] shutting down sender
12828
+ 2021-07-16 00:58:30,203 INFO SenderThread:735392 [dir_watcher.py:finish():282] shutting down directory watcher
12829
+ 2021-07-16 00:58:30,203 INFO WriterThread:735392 [datastore.py:close():288] close: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/run-dq8uirtg.wandb
12830
+ 2021-07-16 00:58:30,205 INFO HandlerThread:735392 [handler.py:finish():638] shutting down handler
12831
+ 2021-07-16 00:58:30,303 INFO SenderThread:735392 [dir_watcher.py:finish():312] scan: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files
12832
+ 2021-07-16 00:58:30,303 INFO SenderThread:735392 [dir_watcher.py:finish():318] scan save: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/requirements.txt requirements.txt
12833
+ 2021-07-16 00:58:30,303 INFO SenderThread:735392 [dir_watcher.py:finish():318] scan save: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/output.log output.log
12834
+ 2021-07-16 00:58:30,303 INFO SenderThread:735392 [dir_watcher.py:finish():318] scan save: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/wandb-metadata.json wandb-metadata.json
12835
+ 2021-07-16 00:58:30,303 INFO SenderThread:735392 [dir_watcher.py:finish():318] scan save: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/config.yaml config.yaml
12836
+ 2021-07-16 00:58:30,303 INFO SenderThread:735392 [dir_watcher.py:finish():318] scan save: /home/dat/pino-roberta-base/wandb/run-20210715_185845-dq8uirtg/files/wandb-summary.json wandb-summary.json
12837
+ 2021-07-16 00:58:30,304 INFO SenderThread:735392 [file_pusher.py:finish():177] shutting down file pusher
12838
+ 2021-07-16 00:58:30,304 INFO SenderThread:735392 [file_pusher.py:join():182] waiting for file pusher
12839
+ 2021-07-16 00:58:30,369 INFO MainThread:735392 [internal.py:handle_exit():78] Internal process exited
wandb/run-20210715_185845-dq8uirtg/logs/debug.log CHANGED
@@ -23,3 +23,5 @@ config: {}
23
  2021-07-15 18:58:47,838 INFO MainThread:734136 [wandb_run.py:_config_callback():872] config_cb None None {'output_dir': './', 'overwrite_output_dir': True, 'do_train': False, 'do_eval': False, 'do_predict': False, 'evaluation_strategy': 'IntervalStrategy.NO', 'prediction_loss_only': False, 'per_device_train_batch_size': 1, 'per_device_eval_batch_size': 1, 'per_gpu_train_batch_size': None, 'per_gpu_eval_batch_size': None, 'gradient_accumulation_steps': 1, 'eval_accumulation_steps': None, 'learning_rate': 3e-05, 'weight_decay': 0.0095, 'adam_beta1': 0.9, 'adam_beta2': 0.98, 'adam_epsilon': 1e-08, 'max_grad_norm': 1.0, 'num_train_epochs': 2.0, 'max_steps': -1, 'lr_scheduler_type': 'SchedulerType.LINEAR', 'warmup_ratio': 0.0, 'warmup_steps': 10000, 'log_level': -1, 'log_level_replica': -1, 'log_on_each_node': True, 'logging_dir': './runs/Jul15_18-58-37_t1v-n-f5c06ea1-w-0', 'logging_strategy': 'IntervalStrategy.STEPS', 'logging_first_step': False, 'logging_steps': 50, 'save_strategy': 'IntervalStrategy.STEPS', 'save_steps': 15000, 'save_total_limit': 20, 'save_on_each_node': False, 'no_cuda': False, 'seed': 42, 'fp16': False, 'fp16_opt_level': 'O1', 'fp16_backend': 'auto', 'fp16_full_eval': False, 'local_rank': -1, 'tpu_num_cores': None, 'tpu_metrics_debug': False, 'debug': [], 'dataloader_drop_last': False, 'eval_steps': 6000, 'dataloader_num_workers': 0, 'past_index': -1, 'run_name': './', 'disable_tqdm': False, 'remove_unused_columns': True, 'label_names': None, 'load_best_model_at_end': False, 'metric_for_best_model': None, 'greater_is_better': None, 'ignore_data_skip': False, 'sharded_ddp': [], 'deepspeed': None, 'label_smoothing_factor': 0.0, 'adafactor': False, 'group_by_length': False, 'length_column_name': 'length', 'report_to': ['tensorboard', 'wandb'], 'ddp_find_unused_parameters': None, 'dataloader_pin_memory': True, 'skip_memory_metrics': True, 'use_legacy_prediction_loop': False, 'push_to_hub': True, 'resume_from_checkpoint': './', 'push_to_hub_model_id': '', 'push_to_hub_organization': None, 'push_to_hub_token': None, 'mp_parameters': ''}
24
  2021-07-15 18:58:47,839 INFO MainThread:734136 [wandb_run.py:_config_callback():872] config_cb None None {'model_name_or_path': None, 'model_type': 'big_bird', 'config_name': './', 'tokenizer_name': './', 'cache_dir': None, 'use_fast_tokenizer': True, 'dtype': 'float32'}
25
  2021-07-15 18:58:47,840 INFO MainThread:734136 [wandb_run.py:_config_callback():872] config_cb None None {'dataset_name': None, 'dataset_config_name': None, 'train_ref_file': None, 'validation_ref_file': None, 'overwrite_cache': False, 'validation_split_percentage': 5, 'max_seq_length': 4096, 'preprocessing_num_workers': 96, 'mlm_probability': 0.15, 'pad_to_max_length': False, 'line_by_line': False, 'max_eval_samples': 4000}
 
 
 
23
  2021-07-15 18:58:47,838 INFO MainThread:734136 [wandb_run.py:_config_callback():872] config_cb None None {'output_dir': './', 'overwrite_output_dir': True, 'do_train': False, 'do_eval': False, 'do_predict': False, 'evaluation_strategy': 'IntervalStrategy.NO', 'prediction_loss_only': False, 'per_device_train_batch_size': 1, 'per_device_eval_batch_size': 1, 'per_gpu_train_batch_size': None, 'per_gpu_eval_batch_size': None, 'gradient_accumulation_steps': 1, 'eval_accumulation_steps': None, 'learning_rate': 3e-05, 'weight_decay': 0.0095, 'adam_beta1': 0.9, 'adam_beta2': 0.98, 'adam_epsilon': 1e-08, 'max_grad_norm': 1.0, 'num_train_epochs': 2.0, 'max_steps': -1, 'lr_scheduler_type': 'SchedulerType.LINEAR', 'warmup_ratio': 0.0, 'warmup_steps': 10000, 'log_level': -1, 'log_level_replica': -1, 'log_on_each_node': True, 'logging_dir': './runs/Jul15_18-58-37_t1v-n-f5c06ea1-w-0', 'logging_strategy': 'IntervalStrategy.STEPS', 'logging_first_step': False, 'logging_steps': 50, 'save_strategy': 'IntervalStrategy.STEPS', 'save_steps': 15000, 'save_total_limit': 20, 'save_on_each_node': False, 'no_cuda': False, 'seed': 42, 'fp16': False, 'fp16_opt_level': 'O1', 'fp16_backend': 'auto', 'fp16_full_eval': False, 'local_rank': -1, 'tpu_num_cores': None, 'tpu_metrics_debug': False, 'debug': [], 'dataloader_drop_last': False, 'eval_steps': 6000, 'dataloader_num_workers': 0, 'past_index': -1, 'run_name': './', 'disable_tqdm': False, 'remove_unused_columns': True, 'label_names': None, 'load_best_model_at_end': False, 'metric_for_best_model': None, 'greater_is_better': None, 'ignore_data_skip': False, 'sharded_ddp': [], 'deepspeed': None, 'label_smoothing_factor': 0.0, 'adafactor': False, 'group_by_length': False, 'length_column_name': 'length', 'report_to': ['tensorboard', 'wandb'], 'ddp_find_unused_parameters': None, 'dataloader_pin_memory': True, 'skip_memory_metrics': True, 'use_legacy_prediction_loop': False, 'push_to_hub': True, 'resume_from_checkpoint': './', 'push_to_hub_model_id': '', 'push_to_hub_organization': None, 'push_to_hub_token': None, 'mp_parameters': ''}
24
  2021-07-15 18:58:47,839 INFO MainThread:734136 [wandb_run.py:_config_callback():872] config_cb None None {'model_name_or_path': None, 'model_type': 'big_bird', 'config_name': './', 'tokenizer_name': './', 'cache_dir': None, 'use_fast_tokenizer': True, 'dtype': 'float32'}
25
  2021-07-15 18:58:47,840 INFO MainThread:734136 [wandb_run.py:_config_callback():872] config_cb None None {'dataset_name': None, 'dataset_config_name': None, 'train_ref_file': None, 'validation_ref_file': None, 'overwrite_cache': False, 'validation_split_percentage': 5, 'max_seq_length': 4096, 'preprocessing_num_workers': 96, 'mlm_probability': 0.15, 'pad_to_max_length': False, 'line_by_line': False, 'max_eval_samples': 4000}
26
+ 2021-07-16 00:58:28,922 INFO MainThread:734136 [wandb_run.py:_atexit_cleanup():1593] got exitcode: 255
27
+ 2021-07-16 00:58:28,922 INFO MainThread:734136 [wandb_run.py:_restore():1565] restore
wandb/run-20210715_185845-dq8uirtg/run-dq8uirtg.wandb CHANGED
Binary files a/wandb/run-20210715_185845-dq8uirtg/run-dq8uirtg.wandb and b/wandb/run-20210715_185845-dq8uirtg/run-dq8uirtg.wandb differ
 
wandb/run-20210716_005946-3bte92ft/files/config.yaml ADDED
@@ -0,0 +1,308 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ wandb_version: 1
2
+
3
+ __cached__setup_devices:
4
+ desc: null
5
+ value: cpu
6
+ _n_gpu:
7
+ desc: null
8
+ value: 0
9
+ _wandb:
10
+ desc: null
11
+ value:
12
+ cli_version: 0.10.33
13
+ framework: huggingface
14
+ huggingface_version: 4.9.0.dev0
15
+ is_jupyter_run: false
16
+ is_kaggle_kernel: false
17
+ python_version: 3.8.10
18
+ t:
19
+ 1:
20
+ - 1
21
+ - 3
22
+ - 11
23
+ 4: 3.8.10
24
+ 5: 0.10.33
25
+ 6: 4.9.0.dev0
26
+ 8:
27
+ - 5
28
+ adafactor:
29
+ desc: null
30
+ value: false
31
+ adam_beta1:
32
+ desc: null
33
+ value: 0.9
34
+ adam_beta2:
35
+ desc: null
36
+ value: 0.98
37
+ adam_epsilon:
38
+ desc: null
39
+ value: 1.0e-08
40
+ cache_dir:
41
+ desc: null
42
+ value: null
43
+ config_name:
44
+ desc: null
45
+ value: ./
46
+ dataloader_drop_last:
47
+ desc: null
48
+ value: false
49
+ dataloader_num_workers:
50
+ desc: null
51
+ value: 0
52
+ dataloader_pin_memory:
53
+ desc: null
54
+ value: true
55
+ dataset_config_name:
56
+ desc: null
57
+ value: null
58
+ dataset_name:
59
+ desc: null
60
+ value: null
61
+ ddp_find_unused_parameters:
62
+ desc: null
63
+ value: null
64
+ debug:
65
+ desc: null
66
+ value: []
67
+ deepspeed:
68
+ desc: null
69
+ value: null
70
+ disable_tqdm:
71
+ desc: null
72
+ value: false
73
+ do_eval:
74
+ desc: null
75
+ value: false
76
+ do_predict:
77
+ desc: null
78
+ value: false
79
+ do_train:
80
+ desc: null
81
+ value: false
82
+ dtype:
83
+ desc: null
84
+ value: float32
85
+ eval_accumulation_steps:
86
+ desc: null
87
+ value: null
88
+ eval_steps:
89
+ desc: null
90
+ value: 6000
91
+ evaluation_strategy:
92
+ desc: null
93
+ value: IntervalStrategy.NO
94
+ fp16:
95
+ desc: null
96
+ value: false
97
+ fp16_backend:
98
+ desc: null
99
+ value: auto
100
+ fp16_full_eval:
101
+ desc: null
102
+ value: false
103
+ fp16_opt_level:
104
+ desc: null
105
+ value: O1
106
+ gradient_accumulation_steps:
107
+ desc: null
108
+ value: 1
109
+ greater_is_better:
110
+ desc: null
111
+ value: null
112
+ group_by_length:
113
+ desc: null
114
+ value: false
115
+ ignore_data_skip:
116
+ desc: null
117
+ value: false
118
+ label_names:
119
+ desc: null
120
+ value: null
121
+ label_smoothing_factor:
122
+ desc: null
123
+ value: 0.0
124
+ learning_rate:
125
+ desc: null
126
+ value: 3.0e-05
127
+ length_column_name:
128
+ desc: null
129
+ value: length
130
+ line_by_line:
131
+ desc: null
132
+ value: false
133
+ load_best_model_at_end:
134
+ desc: null
135
+ value: false
136
+ local_rank:
137
+ desc: null
138
+ value: -1
139
+ log_level:
140
+ desc: null
141
+ value: -1
142
+ log_level_replica:
143
+ desc: null
144
+ value: -1
145
+ log_on_each_node:
146
+ desc: null
147
+ value: true
148
+ logging_dir:
149
+ desc: null
150
+ value: ./runs/Jul16_00-59-37_t1v-n-f5c06ea1-w-0
151
+ logging_first_step:
152
+ desc: null
153
+ value: false
154
+ logging_steps:
155
+ desc: null
156
+ value: 50
157
+ logging_strategy:
158
+ desc: null
159
+ value: IntervalStrategy.STEPS
160
+ lr_scheduler_type:
161
+ desc: null
162
+ value: SchedulerType.LINEAR
163
+ max_eval_samples:
164
+ desc: null
165
+ value: 4000
166
+ max_grad_norm:
167
+ desc: null
168
+ value: 1.0
169
+ max_seq_length:
170
+ desc: null
171
+ value: 4096
172
+ max_steps:
173
+ desc: null
174
+ value: -1
175
+ metric_for_best_model:
176
+ desc: null
177
+ value: null
178
+ mlm_probability:
179
+ desc: null
180
+ value: 0.15
181
+ model_name_or_path:
182
+ desc: null
183
+ value: null
184
+ model_type:
185
+ desc: null
186
+ value: big_bird
187
+ mp_parameters:
188
+ desc: null
189
+ value: ''
190
+ no_cuda:
191
+ desc: null
192
+ value: false
193
+ num_train_epochs:
194
+ desc: null
195
+ value: 3.0
196
+ output_dir:
197
+ desc: null
198
+ value: ./
199
+ overwrite_cache:
200
+ desc: null
201
+ value: false
202
+ overwrite_output_dir:
203
+ desc: null
204
+ value: true
205
+ pad_to_max_length:
206
+ desc: null
207
+ value: false
208
+ past_index:
209
+ desc: null
210
+ value: -1
211
+ per_device_eval_batch_size:
212
+ desc: null
213
+ value: 1
214
+ per_device_train_batch_size:
215
+ desc: null
216
+ value: 1
217
+ per_gpu_eval_batch_size:
218
+ desc: null
219
+ value: null
220
+ per_gpu_train_batch_size:
221
+ desc: null
222
+ value: null
223
+ prediction_loss_only:
224
+ desc: null
225
+ value: false
226
+ preprocessing_num_workers:
227
+ desc: null
228
+ value: 96
229
+ push_to_hub:
230
+ desc: null
231
+ value: true
232
+ push_to_hub_model_id:
233
+ desc: null
234
+ value: ''
235
+ push_to_hub_organization:
236
+ desc: null
237
+ value: null
238
+ push_to_hub_token:
239
+ desc: null
240
+ value: null
241
+ remove_unused_columns:
242
+ desc: null
243
+ value: true
244
+ report_to:
245
+ desc: null
246
+ value:
247
+ - tensorboard
248
+ - wandb
249
+ resume_from_checkpoint:
250
+ desc: null
251
+ value: ./
252
+ run_name:
253
+ desc: null
254
+ value: ./
255
+ save_on_each_node:
256
+ desc: null
257
+ value: false
258
+ save_steps:
259
+ desc: null
260
+ value: 15000
261
+ save_strategy:
262
+ desc: null
263
+ value: IntervalStrategy.STEPS
264
+ save_total_limit:
265
+ desc: null
266
+ value: 20
267
+ seed:
268
+ desc: null
269
+ value: 42
270
+ sharded_ddp:
271
+ desc: null
272
+ value: []
273
+ skip_memory_metrics:
274
+ desc: null
275
+ value: true
276
+ tokenizer_name:
277
+ desc: null
278
+ value: ./
279
+ tpu_metrics_debug:
280
+ desc: null
281
+ value: false
282
+ tpu_num_cores:
283
+ desc: null
284
+ value: null
285
+ train_ref_file:
286
+ desc: null
287
+ value: null
288
+ use_fast_tokenizer:
289
+ desc: null
290
+ value: true
291
+ use_legacy_prediction_loop:
292
+ desc: null
293
+ value: false
294
+ validation_ref_file:
295
+ desc: null
296
+ value: null
297
+ validation_split_percentage:
298
+ desc: null
299
+ value: 5
300
+ warmup_ratio:
301
+ desc: null
302
+ value: 0.0
303
+ warmup_steps:
304
+ desc: null
305
+ value: 10000
306
+ weight_decay:
307
+ desc: null
308
+ value: 0.0095
wandb/run-20210716_005946-3bte92ft/files/output.log ADDED
@@ -0,0 +1,1754 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [01:00:01] - INFO - absl - Restoring checkpoint from ./checkpoint_150000
2
+ tcmalloc: large alloc 1530273792 bytes == 0x9e3b8000 @ 0x7f779c64f680 0x7f779c670824 0x5b9a14 0x50b2ae 0x50cb1b 0x5a6f17 0x5f3010 0x56fd36 0x568d9a 0x5f5b33 0x56aadf 0x568d9a 0x68cdc7 0x67e161 0x67e1df 0x67e281 0x67e627 0x6b6e62 0x6b71ed 0x7f779c4640b3 0x5f96de
3
+ /home/dat/pino/lib/python3.8/site-packages/jax/lib/xla_bridge.py:386: UserWarning: jax.host_count has been renamed to jax.process_count. This alias will eventually be removed; please update your code.
4
+ warnings.warn(
5
+ /home/dat/pino/lib/python3.8/site-packages/jax/lib/xla_bridge.py:373: UserWarning: jax.host_id has been renamed to jax.process_index. This alias will eventually be removed; please update your code.
6
+ warnings.warn(
7
+ Epoch ... (1/3): 0%| | 0/3 [00:00<?, ?it/s]
8
+ Training...: 0it [00:00, ?it/s]
9
+
10
+
11
+
12
+
13
+
14
+ Training...: 54it [04:42, 1.40s/it]
15
+
16
+
17
+
18
+
19
+ Training...: 99it [04:49, 2.67it/s]
20
+
21
+
22
+
23
+
24
+
25
+ Training...: 178it [05:24, 12.74it/s]
26
+
27
+
28
+
29
+ Training...: 199it [05:29, 2.69it/s]
30
+
31
+
32
+
33
+
34
+
35
+ Training...: 249it [05:49, 2.67it/s]
36
+
37
+
38
+
39
+
40
+
41
+
42
+ Training...: 300it [06:22, 4.01s/it]
43
+
44
+
45
+
46
+
47
+ Training...: 349it [06:29, 2.68it/s]
48
+
49
+
50
+
51
+
52
+
53
+ Training...: 399it [06:49, 2.74it/s]
54
+
55
+
56
+
57
+
58
+ Training...: 449it [07:09, 2.67it/s]
59
+
60
+
61
+
62
+
63
+ Training...: 499it [07:29, 2.67it/s]
64
+
65
+
66
+
67
+
68
+ Training...: 549it [07:49, 2.70it/s]
69
+
70
+
71
+
72
+
73
+ Training...: 599it [08:09, 2.68it/s]
74
+
75
+
76
+
77
+
78
+ Training...: 649it [08:29, 2.70it/s]
79
+
80
+
81
+
82
+
83
+
84
+ Training...: 699it [08:49, 2.67it/s]
85
+
86
+
87
+
88
+
89
+
90
+ Training...: 749it [09:09, 2.70it/s]
91
+
92
+
93
+
94
+
95
+
96
+ Training...: 799it [09:29, 2.68it/s]
97
+
98
+
99
+
100
+
101
+
102
+ Training...: 849it [09:49, 2.67it/s]
103
+
104
+
105
+
106
+
107
+
108
+
109
+ Training...: 906it [10:23, 1.09it/s]
110
+
111
+
112
+
113
+
114
+
115
+ Training...: 956it [10:43, 1.09it/s]
116
+
117
+
118
+
119
+
120
+
121
+ Training...: 1006it [11:03, 1.09it/s]
122
+
123
+
124
+
125
+
126
+
127
+ Training...: 1056it [11:23, 1.09it/s]
128
+
129
+
130
+
131
+
132
+ Training...: 1099it [11:29, 2.67it/s]
133
+
134
+
135
+
136
+
137
+ Training...: 1149it [11:49, 2.67it/s]
138
+
139
+
140
+
141
+
142
+
143
+ Training...: 1199it [12:09, 2.67it/s]
144
+
145
+
146
+
147
+
148
+
149
+ Training...: 1249it [12:29, 2.70it/s]
150
+
151
+
152
+
153
+
154
+
155
+ Training...: 1299it [12:50, 2.67it/s]
156
+
157
+
158
+
159
+
160
+
161
+ Training...: 1349it [13:10, 2.69it/s]
162
+
163
+
164
+
165
+
166
+
167
+ Training...: 1399it [13:30, 2.68it/s]
168
+
169
+
170
+
171
+
172
+
173
+ Training...: 1449it [13:50, 2.67it/s]
174
+
175
+
176
+
177
+
178
+
179
+ Training...: 1499it [14:10, 2.67it/s]
180
+
181
+
182
+
183
+
184
+
185
+
186
+ Training...: 1550it [14:43, 4.01s/it]
187
+
188
+
189
+
190
+
191
+ Training...: 1599it [14:50, 2.70it/s]
192
+
193
+
194
+
195
+
196
+
197
+ Training...: 1649it [15:10, 2.65it/s]
198
+
199
+
200
+
201
+
202
+
203
+ Training...: 1699it [15:30, 2.69it/s]
204
+
205
+
206
+
207
+
208
+
209
+ Training...: 1749it [15:50, 2.68it/s]
210
+
211
+
212
+
213
+
214
+
215
+ Training...: 1799it [16:10, 2.67it/s]
216
+
217
+
218
+
219
+
220
+
221
+ Training...: 1849it [16:30, 2.67it/s]
222
+
223
+
224
+
225
+
226
+
227
+ Training...: 1899it [16:50, 2.67it/s]
228
+
229
+
230
+
231
+
232
+
233
+ Training...: 1949it [17:10, 2.70it/s]
234
+
235
+
236
+
237
+
238
+
239
+ Training...: 1999it [17:30, 2.68it/s]
240
+
241
+
242
+
243
+
244
+
245
+ Training...: 2049it [17:50, 2.70it/s]
246
+
247
+
248
+
249
+
250
+
251
+ Training...: 2099it [18:10, 2.67it/s]
252
+
253
+
254
+
255
+
256
+
257
+ Training...: 2149it [18:30, 2.68it/s]
258
+
259
+
260
+
261
+
262
+
263
+ Training...: 2199it [18:50, 2.68it/s]
264
+
265
+
266
+
267
+
268
+
269
+ Training...: 2249it [19:10, 2.68it/s]
270
+
271
+
272
+
273
+
274
+
275
+ Training...: 2299it [19:30, 2.70it/s]
276
+
277
+
278
+
279
+
280
+
281
+ Training...: 2349it [19:50, 2.67it/s]
282
+
283
+
284
+
285
+
286
+
287
+ Training...: 2399it [20:10, 2.70it/s]
288
+
289
+
290
+
291
+
292
+
293
+ Training...: 2449it [20:30, 2.67it/s]
294
+
295
+
296
+
297
+
298
+
299
+ Training...: 2499it [20:50, 2.63it/s]
300
+
301
+
302
+
303
+
304
+
305
+ Training...: 2549it [21:11, 2.68it/s]
306
+
307
+
308
+
309
+
310
+
311
+ Training...: 2599it [21:31, 2.68it/s]
312
+
313
+
314
+
315
+
316
+
317
+ Training...: 2649it [21:51, 2.73it/s]
318
+
319
+
320
+
321
+
322
+
323
+ Training...: 2699it [22:11, 2.67it/s]
324
+
325
+
326
+
327
+
328
+
329
+ Training...: 2749it [22:31, 2.67it/s]
330
+
331
+
332
+
333
+
334
+
335
+ Training...: 2799it [22:51, 2.68it/s]
336
+
337
+
338
+
339
+
340
+
341
+ Training...: 2849it [23:11, 2.64it/s]
342
+
343
+
344
+
345
+
346
+
347
+ Training...: 2899it [23:31, 2.68it/s]
348
+
349
+
350
+
351
+
352
+
353
+ Training...: 2949it [23:51, 2.68it/s]
354
+
355
+
356
+
357
+
358
+
359
+ Training...: 2999it [24:11, 2.74it/s]
360
+
361
+
362
+
363
+
364
+
365
+
366
+ Training...: 3058it [24:45, 1.59it/s]
367
+
368
+
369
+
370
+
371
+ Training...: 3099it [24:51, 2.70it/s]
372
+
373
+
374
+
375
+
376
+
377
+ Training...: 3149it [25:11, 2.67it/s]
378
+
379
+
380
+
381
+
382
+
383
+ Training...: 3199it [25:31, 2.69it/s]
384
+
385
+
386
+
387
+
388
+
389
+ Training...: 3249it [25:51, 2.68it/s]
390
+
391
+
392
+
393
+
394
+
395
+
396
+ Training...: 3300it [26:24, 4.01s/it]
397
+
398
+
399
+
400
+
401
+
402
+ Training...: 3354it [26:45, 1.39s/it]
403
+
404
+
405
+
406
+
407
+ Training...: 3399it [26:51, 2.68it/s]
408
+
409
+
410
+
411
+
412
+
413
+ Training...: 3449it [27:11, 2.70it/s]
414
+
415
+
416
+
417
+
418
+
419
+ Training...: 3499it [27:31, 2.67it/s]
420
+
421
+
422
+
423
+
424
+
425
+
426
+ Training...: 3558it [28:05, 1.59it/s]
427
+
428
+
429
+
430
+
431
+
432
+ Training...: 3608it [28:25, 1.59it/s]
433
+
434
+
435
+
436
+
437
+
438
+ Training...: 3658it [28:45, 1.60it/s]
439
+
440
+
441
+
442
+
443
+ Training...: 3699it [28:52, 2.67it/s]
444
+
445
+
446
+
447
+
448
+
449
+ Training...: 3749it [29:12, 2.67it/s]
450
+
451
+
452
+
453
+
454
+
455
+
456
+ Training...: 3804it [29:45, 1.39s/it]
457
+
458
+
459
+
460
+
461
+ Training...: 3849it [29:52, 2.68it/s]
462
+
463
+
464
+
465
+
466
+
467
+ Training...: 3899it [30:12, 2.69it/s]
468
+
469
+
470
+
471
+
472
+
473
+
474
+ Training...: 3956it [30:45, 1.09it/s]
475
+
476
+
477
+
478
+
479
+ Training...: 3999it [30:52, 2.68it/s]
480
+
481
+
482
+
483
+
484
+
485
+
486
+ Training...: 4057it [31:25, 1.46it/s]
487
+
488
+
489
+
490
+
491
+ Training...: 4099it [31:32, 2.66it/s]
492
+
493
+
494
+
495
+
496
+
497
+
498
+ Training...: 4152it [32:05, 2.25s/it]
499
+
500
+
501
+
502
+
503
+
504
+ Training...: 4201it [32:25, 2.88s/it]
505
+
506
+
507
+
508
+
509
+ Training...: 4249it [32:32, 2.66it/s]
510
+
511
+
512
+
513
+
514
+
515
+ Training...: 4299it [32:52, 2.68it/s]
516
+
517
+
518
+
519
+
520
+
521
+
522
+ Training...: 4356it [33:26, 1.09it/s]
523
+
524
+
525
+
526
+
527
+ Training...: 4399it [33:32, 2.68it/s]
528
+
529
+
530
+
531
+
532
+
533
+ Training...: 4449it [33:52, 2.67it/s]
534
+
535
+
536
+
537
+
538
+
539
+ Training...: 4499it [34:12, 2.69it/s]
540
+
541
+
542
+
543
+
544
+
545
+ Training...: 4549it [34:32, 2.68it/s]
546
+
547
+
548
+
549
+
550
+
551
+ Training...: 4599it [34:52, 2.69it/s]
552
+
553
+
554
+
555
+
556
+
557
+ Training...: 4649it [35:12, 2.68it/s]
558
+
559
+
560
+
561
+
562
+
563
+
564
+ Training...: 4703it [35:46, 1.64s/it]
565
+
566
+
567
+
568
+
569
+ Training...: 4749it [35:52, 2.67it/s]
570
+
571
+
572
+
573
+
574
+
575
+
576
+ Training...: 4806it [36:26, 1.09it/s]
577
+
578
+
579
+
580
+
581
+ Training...: 4849it [36:32, 2.70it/s]
582
+
583
+
584
+
585
+
586
+
587
+ Training...: 4899it [36:53, 2.67it/s]
588
+
589
+
590
+
591
+
592
+
593
+
594
+ Training...: 4958it [37:26, 1.59it/s]
595
+
596
+
597
+
598
+
599
+ Training...: 4999it [37:33, 2.65it/s]
600
+
601
+
602
+
603
+
604
+
605
+ Training...: 5049it [37:53, 2.30it/s]
606
+
607
+
608
+
609
+
610
+
611
+ Training...: 5099it [38:13, 2.68it/s]
612
+
613
+
614
+
615
+
616
+
617
+
618
+ Training...: 5152it [38:46, 2.25s/it]
619
+
620
+
621
+
622
+
623
+
624
+ Training...: 5206it [39:06, 1.09it/s]
625
+
626
+
627
+
628
+
629
+ Training...: 5249it [39:13, 2.68it/s]
630
+
631
+
632
+
633
+
634
+
635
+ Training...: 5299it [39:33, 2.69it/s]
636
+
637
+
638
+
639
+
640
+
641
+
642
+ Training...: 5358it [40:07, 1.59it/s]
643
+
644
+
645
+
646
+
647
+
648
+ Training...: 5408it [40:27, 1.58it/s]
649
+
650
+
651
+
652
+
653
+
654
+ Training...: 5460it [40:47, 2.24it/s]
655
+
656
+
657
+
658
+
659
+ Training...: 5499it [40:53, 2.68it/s]
660
+
661
+
662
+
663
+
664
+
665
+ Training...: 5549it [41:13, 2.70it/s]
666
+
667
+
668
+
669
+
670
+
671
+ Training...: 5599it [41:33, 2.67it/s]
672
+
673
+
674
+
675
+
676
+
677
+ Training...: 5649it [41:53, 2.68it/s]
678
+
679
+
680
+
681
+
682
+
683
+ Training...: 5699it [42:13, 2.67it/s]
684
+
685
+
686
+
687
+
688
+
689
+
690
+ Training...: 5756it [42:47, 1.09it/s]
691
+
692
+
693
+
694
+
695
+ Training...: 5799it [42:53, 2.68it/s]
696
+
697
+
698
+
699
+
700
+
701
+
702
+ Training...: 5856it [43:27, 1.09it/s]
703
+
704
+
705
+
706
+
707
+
708
+ Training...: 5906it [43:47, 1.09it/s]
709
+
710
+
711
+
712
+
713
+ Training...: 5949it [43:53, 2.68it/s]
714
+
715
+
716
+
717
+
718
+
719
+ Training...: 5999it [44:27, 2.69it/s]
720
+ Evaluating ...: 0%| | 0/500 [00:00<?, ?it/s]
721
+
722
+
723
+
724
+
725
+
726
+
727
+
728
+
729
+
730
+
731
+
732
+
733
+
734
+
735
+
736
+
737
+
738
+
739
+
740
+
741
+
742
+
743
+
744
+
745
+
746
+
747
+
748
+
749
+
750
+
751
+
752
+
753
+
754
+
755
+
756
+ Training...: 6049it [45:56, 2.66it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
757
+
758
+
759
+
760
+
761
+
762
+ Training...: 6099it [46:16, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
763
+
764
+
765
+
766
+
767
+
768
+ Training...: 6149it [46:36, 2.72it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
769
+
770
+
771
+
772
+
773
+
774
+ Training...: 6199it [46:56, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
775
+
776
+
777
+
778
+
779
+ Training...: 6249it [47:16, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
780
+
781
+
782
+
783
+
784
+ Training...: 6299it [47:36, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
785
+
786
+
787
+
788
+
789
+ Training...: 6349it [47:56, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
790
+
791
+
792
+
793
+
794
+
795
+ Training...: 6399it [48:16, 2.70it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
796
+
797
+
798
+
799
+
800
+
801
+ Training...: 6449it [48:36, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
802
+
803
+
804
+
805
+
806
+
807
+ Training...: 6499it [48:56, 2.69it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
808
+
809
+
810
+
811
+
812
+
813
+ Training...: 6549it [49:16, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
814
+
815
+
816
+
817
+
818
+ Training...: 6599it [49:36, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
819
+
820
+
821
+
822
+
823
+ Training...: 6649it [49:56, 2.71it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
824
+
825
+
826
+
827
+
828
+ Training...: 6699it [50:16, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
829
+
830
+
831
+
832
+
833
+
834
+ Training...: 6749it [50:36, 2.69it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
835
+
836
+
837
+
838
+
839
+
840
+ Training...: 6799it [50:56, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
841
+
842
+
843
+
844
+
845
+
846
+ Training...: 6849it [51:16, 2.67it/s]███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████��████| 500/500 [01:17<00:00, 7.90it/s]
847
+
848
+
849
+
850
+
851
+
852
+ Training...: 6899it [51:37, 2.70it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
853
+
854
+
855
+
856
+
857
+
858
+ Training...: 6949it [51:57, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
859
+
860
+
861
+
862
+
863
+ Training...: 6999it [52:17, 2.70it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
864
+
865
+
866
+
867
+
868
+ Training...: 7049it [52:37, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
869
+
870
+
871
+
872
+
873
+
874
+ Training...: 7099it [52:57, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
875
+
876
+
877
+
878
+
879
+
880
+ Training...: 7149it [53:17, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
881
+
882
+
883
+
884
+
885
+ Training...: 7199it [53:37, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
886
+
887
+
888
+
889
+
890
+ Training...: 7249it [53:57, 2.71it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
891
+
892
+
893
+
894
+
895
+ Training...: 7299it [54:17, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
896
+
897
+
898
+
899
+
900
+ Training...: 7349it [54:37, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
901
+
902
+
903
+
904
+
905
+ Training...: 7399it [54:57, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
906
+
907
+
908
+
909
+
910
+ Training...: 7449it [55:17, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
911
+
912
+
913
+
914
+
915
+ Training...: 7499it [55:37, 2.70it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
916
+
917
+
918
+
919
+
920
+ Training...: 7549it [55:57, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
921
+
922
+
923
+
924
+
925
+ Training...: 7599it [56:17, 2.69it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
926
+
927
+
928
+
929
+
930
+ Training...: 7649it [56:37, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
931
+
932
+
933
+
934
+
935
+ Training...: 7699it [56:57, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
936
+
937
+
938
+
939
+
940
+ Training...: 7749it [57:17, 2.70it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
941
+
942
+
943
+
944
+
945
+ Training...: 7799it [57:37, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
946
+
947
+
948
+
949
+
950
+ Training...: 7849it [57:57, 2.69it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
951
+
952
+
953
+
954
+
955
+ Training...: 7899it [58:17, 2.67it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
956
+
957
+
958
+
959
+
960
+ Training...: 7949it [58:37, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
961
+
962
+
963
+
964
+
965
+ Training...: 7999it [58:57, 2.70it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
966
+
967
+
968
+
969
+
970
+ Training...: 8049it [59:18, 2.65it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
971
+
972
+
973
+
974
+
975
+ Training...: 8099it [59:38, 2.70it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
976
+
977
+
978
+
979
+
980
+ Training...: 8149it [59:58, 2.68it/s]████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
981
+
982
+
983
+
984
+
985
+ Training...: 8199it [1:00:18, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
986
+
987
+
988
+
989
+
990
+ Training...: 8249it [1:00:38, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
991
+
992
+
993
+
994
+
995
+ Training...: 8299it [1:00:58, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
996
+
997
+
998
+
999
+
1000
+ Training...: 8349it [1:01:18, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1001
+
1002
+
1003
+
1004
+
1005
+ Training...: 8399it [1:01:38, 2.69it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1006
+
1007
+
1008
+
1009
+
1010
+ Training...: 8449it [1:01:58, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1011
+
1012
+
1013
+
1014
+
1015
+ Training...: 8499it [1:02:18, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1016
+
1017
+
1018
+
1019
+
1020
+ Training...: 8549it [1:02:38, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1021
+
1022
+
1023
+
1024
+
1025
+ Training...: 8599it [1:02:58, 2.71it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1026
+
1027
+
1028
+
1029
+
1030
+ Training...: 8649it [1:03:18, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1031
+
1032
+
1033
+
1034
+
1035
+ Training...: 8699it [1:03:38, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1036
+
1037
+
1038
+
1039
+
1040
+ Training...: 8749it [1:03:58, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1041
+
1042
+
1043
+
1044
+
1045
+ Training...: 8799it [1:04:18, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1046
+
1047
+
1048
+
1049
+
1050
+ Training...: 8849it [1:04:38, 2.70it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1051
+
1052
+
1053
+
1054
+
1055
+ Training...: 8899it [1:04:58, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1056
+
1057
+
1058
+
1059
+
1060
+ Training...: 8949it [1:05:18, 2.70it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1061
+
1062
+
1063
+
1064
+
1065
+ Training...: 8999it [1:05:38, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1066
+
1067
+
1068
+
1069
+
1070
+ Training...: 9049it [1:05:58, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1071
+
1072
+
1073
+
1074
+
1075
+ Training...: 9099it [1:06:18, 2.70it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1076
+
1077
+
1078
+
1079
+
1080
+ Training...: 9149it [1:06:38, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1081
+
1082
+
1083
+
1084
+
1085
+ Training...: 9199it [1:06:58, 2.70it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1086
+
1087
+
1088
+
1089
+
1090
+ Training...: 9249it [1:07:18, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1091
+
1092
+
1093
+
1094
+
1095
+ Training...: 9299it [1:07:39, 2.75it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1096
+
1097
+
1098
+
1099
+
1100
+ Training...: 9349it [1:07:59, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1101
+
1102
+
1103
+
1104
+
1105
+ Training...: 9399it [1:08:19, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1106
+
1107
+
1108
+
1109
+
1110
+ Training...: 9449it [1:08:39, 2.71it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1111
+
1112
+
1113
+
1114
+
1115
+ Training...: 9499it [1:08:59, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1116
+
1117
+
1118
+
1119
+
1120
+ Training...: 9549it [1:09:19, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████��████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1121
+
1122
+
1123
+
1124
+
1125
+ Training...: 9599it [1:09:39, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1126
+
1127
+
1128
+
1129
+
1130
+ Training...: 9649it [1:09:59, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1131
+
1132
+
1133
+
1134
+
1135
+ Training...: 9699it [1:10:19, 2.71it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1136
+
1137
+
1138
+
1139
+
1140
+ Training...: 9749it [1:10:39, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1141
+
1142
+
1143
+
1144
+
1145
+ Training...: 9799it [1:10:59, 2.69it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1146
+
1147
+
1148
+
1149
+
1150
+ Training...: 9849it [1:11:19, 2.68it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1151
+
1152
+
1153
+
1154
+
1155
+ Training...: 9899it [1:11:39, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1156
+
1157
+
1158
+
1159
+
1160
+ Training...: 9949it [1:11:59, 2.71it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1161
+
1162
+
1163
+
1164
+
1165
+ Training...: 9999it [1:12:19, 2.67it/s]██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1166
+
1167
+
1168
+
1169
+
1170
+ Training...: 10049it [1:12:39, 2.69it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1171
+
1172
+
1173
+
1174
+
1175
+ Training...: 10099it [1:12:59, 2.67it/s]██████████████████████████████████████████████████████████��██████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1176
+
1177
+
1178
+
1179
+
1180
+ Training...: 10149it [1:13:19, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1181
+
1182
+
1183
+
1184
+
1185
+ Training...: 10199it [1:13:39, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1186
+
1187
+
1188
+
1189
+
1190
+ Training...: 10249it [1:13:59, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1191
+
1192
+
1193
+
1194
+
1195
+ Training...: 10299it [1:14:19, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1196
+
1197
+
1198
+
1199
+
1200
+ Training...: 10349it [1:14:39, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1201
+
1202
+
1203
+
1204
+
1205
+ Training...: 10399it [1:14:59, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1206
+
1207
+
1208
+
1209
+
1210
+ Training...: 10449it [1:15:19, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1211
+
1212
+
1213
+
1214
+
1215
+ Training...: 10499it [1:15:39, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1216
+
1217
+
1218
+
1219
+
1220
+ Training...: 10549it [1:16:00, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1221
+
1222
+
1223
+
1224
+
1225
+ Training...: 10599it [1:16:20, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1226
+
1227
+
1228
+
1229
+
1230
+ Training...: 10649it [1:16:40, 2.67it/s]██████████████████████████████████��██████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1231
+
1232
+
1233
+
1234
+
1235
+ Training...: 10699it [1:17:00, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1236
+
1237
+
1238
+
1239
+
1240
+ Training...: 10749it [1:17:20, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1241
+
1242
+
1243
+
1244
+
1245
+ Training...: 10799it [1:17:40, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1246
+
1247
+
1248
+
1249
+
1250
+ Training...: 10849it [1:18:00, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1251
+
1252
+
1253
+
1254
+
1255
+ Training...: 10899it [1:18:20, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1256
+
1257
+
1258
+
1259
+
1260
+ Training...: 10949it [1:18:40, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1261
+
1262
+
1263
+
1264
+
1265
+ Training...: 10999it [1:19:00, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1266
+
1267
+
1268
+
1269
+
1270
+ Training...: 11049it [1:19:20, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1271
+
1272
+
1273
+
1274
+
1275
+ Training...: 11099it [1:19:40, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1276
+
1277
+
1278
+
1279
+
1280
+ Training...: 11149it [1:20:00, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1281
+
1282
+
1283
+
1284
+
1285
+ Training...: 11199it [1:20:20, 2.68it/s]██████████��██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1286
+
1287
+
1288
+
1289
+
1290
+ Training...: 11249it [1:20:40, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1291
+
1292
+
1293
+
1294
+
1295
+ Training...: 11299it [1:21:00, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1296
+
1297
+
1298
+
1299
+
1300
+ Training...: 11349it [1:21:20, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1301
+
1302
+
1303
+
1304
+
1305
+ Training...: 11399it [1:21:40, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1306
+
1307
+
1308
+
1309
+
1310
+ Training...: 11449it [1:22:00, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1311
+
1312
+
1313
+
1314
+
1315
+ Training...: 11499it [1:22:20, 2.76it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1316
+
1317
+
1318
+
1319
+
1320
+ Training...: 11549it [1:22:40, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1321
+
1322
+
1323
+
1324
+
1325
+ Training...: 11599it [1:23:00, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1326
+
1327
+
1328
+
1329
+
1330
+ Training...: 11649it [1:23:20, 2.71it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1331
+
1332
+
1333
+
1334
+
1335
+ Training...: 11699it [1:23:40, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1336
+
1337
+
1338
+
1339
+
1340
+ Training...: 11749it [1:24:00, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1341
+
1342
+
1343
+
1344
+
1345
+ Training...: 11799it [1:24:21, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1346
+
1347
+
1348
+
1349
+
1350
+ Training...: 11849it [1:24:41, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1351
+
1352
+
1353
+
1354
+
1355
+ Training...: 11899it [1:25:01, 2.70it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1356
+
1357
+
1358
+
1359
+
1360
+ Training...: 11949it [1:25:21, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1361
+
1362
+
1363
+
1364
+
1365
+ Training...: 11999it [1:25:41, 2.69it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1366
+ Training...: 11999it [1:25:54, 2.69it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [01:17<00:00, 7.90it/s]
1367
+
1368
+
1369
+
1370
+
1371
+
1372
+
1373
+
1374
+
1375
+
1376
+
1377
+
1378
+
1379
+
1380
+
1381
+
1382
+
1383
+
1384
+
1385
+
1386
+
1387
+
1388
+
1389
+
1390
+
1391
+
1392
+
1393
+
1394
+
1395
+
1396
+
1397
+
1398
+
1399
+
1400
+ Training...: 12049it [1:27:05, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1401
+
1402
+
1403
+
1404
+
1405
+ Training...: 12099it [1:27:25, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1406
+
1407
+
1408
+
1409
+
1410
+
1411
+ █████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1412
+
1413
+
1414
+
1415
+
1416
+
1417
+ Training...: 12200it [1:28:18, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1418
+
1419
+
1420
+
1421
+
1422
+ Training...: 12249it [1:28:25, 2.71it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1423
+
1424
+
1425
+
1426
+
1427
+ Training...: 12299it [1:28:45, 2.67it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1428
+
1429
+
1430
+
1431
+
1432
+
1433
+ Training...: 12350it [1:29:18, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1434
+
1435
+
1436
+
1437
+
1438
+
1439
+ Training...: 12400it [1:29:38, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1440
+
1441
+
1442
+
1443
+
1444
+
1445
+ Training...: 12450it [1:29:58, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1446
+
1447
+
1448
+
1449
+
1450
+
1451
+ Training...: 12504it [1:30:19, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1452
+
1453
+
1454
+
1455
+
1456
+
1457
+ Training...: 12554it [1:30:39, 1.40s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1458
+
1459
+
1460
+
1461
+
1462
+ Training...: 12599it [1:30:45, 2.63it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1463
+
1464
+
1465
+
1466
+
1467
+ Training...: 12649it [1:31:05, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1468
+
1469
+
1470
+
1471
+
1472
+ Training...: 12699it [1:31:25, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1473
+
1474
+
1475
+
1476
+
1477
+
1478
+ Training...: 12750it [1:31:59, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1479
+
1480
+
1481
+
1482
+
1483
+
1484
+ Training...: 12800it [1:32:19, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1485
+
1486
+
1487
+
1488
+
1489
+
1490
+ Training...: 12854it [1:32:39, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1491
+
1492
+
1493
+
1494
+
1495
+
1496
+ Training...: 12906it [1:32:59, 1.09it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1497
+
1498
+
1499
+
1500
+
1501
+ Training...: 12949it [1:33:06, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1502
+
1503
+
1504
+
1505
+
1506
+
1507
+ Training...: 13000it [1:33:39, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1508
+
1509
+
1510
+
1511
+
1512
+
1513
+ Training...: 13052it [1:33:59, 2.24s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1514
+
1515
+
1516
+
1517
+
1518
+
1519
+ Training...: 13102it [1:34:19, 2.25s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1520
+
1521
+
1522
+
1523
+
1524
+
1525
+ Training...: 13152it [1:34:39, 2.25s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1526
+
1527
+
1528
+
1529
+
1530
+
1531
+ Training...: 13200it [1:34:59, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1532
+
1533
+
1534
+
1535
+
1536
+
1537
+ Training...: 13250it [1:35:19, 4.07s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1538
+
1539
+
1540
+
1541
+
1542
+
1543
+ Training...: 13302it [1:35:39, 2.25s/it]███████████████████████████████████████████���█████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1544
+
1545
+
1546
+
1547
+
1548
+
1549
+ Training...: 13352it [1:35:59, 2.24s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1550
+
1551
+
1552
+
1553
+
1554
+
1555
+ Training...: 13402it [1:36:19, 2.24s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1556
+
1557
+
1558
+
1559
+
1560
+
1561
+ Training...: 13452it [1:36:39, 2.25s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1562
+
1563
+
1564
+
1565
+
1566
+
1567
+ Training...: 13504it [1:37:00, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1568
+
1569
+
1570
+
1571
+
1572
+
1573
+ Training...: 13554it [1:37:20, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1574
+
1575
+
1576
+
1577
+
1578
+
1579
+ Training...: 13604it [1:37:40, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1580
+
1581
+
1582
+
1583
+
1584
+
1585
+ Training...: 13656it [1:38:00, 1.09it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1586
+
1587
+
1588
+
1589
+
1590
+
1591
+ Training...: 13706it [1:38:20, 1.08it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1592
+
1593
+
1594
+
1595
+
1596
+
1597
+ Training...: 13756it [1:38:40, 1.09it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1598
+
1599
+
1600
+
1601
+
1602
+
1603
+ Training...: 13808it [1:39:00, 1.59it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1604
+
1605
+
1606
+
1607
+
1608
+
1609
+ Training...: 13858it [1:39:20, 1.59it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1610
+
1611
+
1612
+
1613
+
1614
+
1615
+ Training...: 13910it [1:39:40, 2.25it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1616
+
1617
+
1618
+
1619
+
1620
+
1621
+ Training...: 13954it [1:40:00, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1622
+
1623
+
1624
+
1625
+
1626
+
1627
+ Training...: 14004it [1:40:20, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1628
+
1629
+
1630
+
1631
+
1632
+
1633
+ Training...: 14054it [1:40:40, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1634
+
1635
+
1636
+
1637
+
1638
+
1639
+ Training...: 14108it [1:41:00, 1.59it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1640
+
1641
+
1642
+
1643
+
1644
+
1645
+ Training...: 14152it [1:41:20, 2.25s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1646
+
1647
+
1648
+
1649
+
1650
+
1651
+ Training...: 14210it [1:41:41, 2.25it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1652
+
1653
+
1654
+
1655
+
1656
+
1657
+ Training...: 14252it [1:42:00, 2.25s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1658
+
1659
+
1660
+
1661
+
1662
+
1663
+ Training...: 14300it [1:42:20, 4.01s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1664
+
1665
+
1666
+
1667
+
1668
+
1669
+ Training...: 14350it [1:42:40, 4.07s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1670
+
1671
+
1672
+
1673
+
1674
+
1675
+ Training...: 14402it [1:43:00, 2.25s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1676
+
1677
+
1678
+
1679
+
1680
+
1681
+ Training...: 14452it [1:43:21, 2.24s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1682
+
1683
+
1684
+
1685
+
1686
+
1687
+ Training...: 14502it [1:43:41, 2.25s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1688
+
1689
+
1690
+
1691
+
1692
+
1693
+ Training...: 14552it [1:44:01, 2.24s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1694
+
1695
+
1696
+
1697
+
1698
+
1699
+ Training...: 14604it [1:44:21, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1700
+
1701
+
1702
+
1703
+
1704
+
1705
+ Training...: 14654it [1:44:41, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1706
+
1707
+
1708
+
1709
+
1710
+
1711
+ Training...: 14704it [1:45:01, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1712
+
1713
+
1714
+
1715
+
1716
+
1717
+ Training...: 14754it [1:45:21, 1.40s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1718
+
1719
+
1720
+
1721
+
1722
+
1723
+ Training...: 14804it [1:45:41, 1.41s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1724
+
1725
+
1726
+
1727
+
1728
+
1729
+ Training...: 14854it [1:46:01, 1.39s/it]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1730
+
1731
+
1732
+
1733
+
1734
+
1735
+ Training...: 14904it [1:46:21, 1.39s/it]███████████████████████████████████████████████████████████████████████████████████████████████████████████���█████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1736
+
1737
+
1738
+
1739
+
1740
+
1741
+ Training...: 14956it [1:46:41, 1.09it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1742
+
1743
+
1744
+
1745
+
1746
+
1747
+ Training...: 14999it [1:47:01, 2.68it/s]█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 500/500 [00:59<00:00, 7.91it/s]
1748
+
1749
+ tcmalloc: large alloc 1354776576 bytes == 0x37c662000 @ 0x7f779c64f680 0x7f779c66fbdd 0x7f7782c0920d 0x7f7782c17340 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c12bd3 0x7f7782c131fe 0x504d56 0x56acb6 0x568d9a 0x5f5b33 0x56bc9b 0x5f5956 0x56aadf 0x5f5956 0x56fb87 0x568d9a 0x5f5b33 0x56bc9b 0x568d9a 0x68cdc7 0x67e161 0x67e1df
1750
+ tcmalloc: large alloc 2715181056 bytes == 0x3cda66000 @ 0x7f779c64f680 0x7f779c66fbdd 0x7f7782c0920d 0x7f7782c17340 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c16e87 0x7f7782c12bd3 0x7f7782c131fe 0x504d56 0x56acb6 0x568d9a 0x5f5b33 0x56bc9b 0x5f5956 0x56aadf 0x5f5956 0x56fb87 0x568d9a 0x5f5b33 0x56bc9b 0x568d9a
1751
+ tcmalloc: large alloc 1530273792 bytes == 0x32311e000 @ 0x7f779c64f680 0x7f779c670824 0x5f7b11 0x7f7782c12c6f 0x7f7782c131fe 0x504d56 0x56acb6 0x568d9a 0x5f5b33 0x56bc9b 0x5f5956 0x56aadf 0x5f5956 0x56fb87 0x568d9a 0x5f5b33 0x56bc9b 0x568d9a 0x68cdc7 0x67e161 0x67e1df 0x67e281 0x67e627 0x6b6e62 0x6b71ed 0x7f779c4640b3 0x5f96de
1752
+ [02:52:47] - INFO - absl - Saved checkpoint at checkpoint_165000
1753
+ [02:52:48] - INFO - huggingface_hub.repository - git version 2.25.1
1754
+ git-lfs/2.9.2 (GitHub; linux amd64; go 1.13.5)
wandb/run-20210716_005946-3bte92ft/files/requirements.txt ADDED
@@ -0,0 +1,95 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ absl-py==0.13.0
2
+ aiohttp==3.7.4.post0
3
+ astunparse==1.6.3
4
+ async-timeout==3.0.1
5
+ attrs==21.2.0
6
+ cachetools==4.2.2
7
+ certifi==2021.5.30
8
+ chardet==4.0.0
9
+ charset-normalizer==2.0.1
10
+ chex==0.0.8
11
+ click==8.0.1
12
+ configparser==5.0.2
13
+ cycler==0.10.0
14
+ datasets==1.9.1.dev0
15
+ dill==0.3.4
16
+ dm-tree==0.1.6
17
+ docker-pycreds==0.4.0
18
+ filelock==3.0.12
19
+ flatbuffers==1.12
20
+ flax==0.3.4
21
+ fsspec==2021.7.0
22
+ gast==0.4.0
23
+ gitdb==4.0.7
24
+ gitpython==3.1.18
25
+ google-auth-oauthlib==0.4.4
26
+ google-auth==1.32.1
27
+ google-pasta==0.2.0
28
+ grpcio==1.34.1
29
+ h5py==3.1.0
30
+ huggingface-hub==0.0.12
31
+ idna==3.2
32
+ install==1.3.4
33
+ jax==0.2.17
34
+ jaxlib==0.1.68
35
+ joblib==1.0.1
36
+ keras-nightly==2.5.0.dev2021032900
37
+ keras-preprocessing==1.1.2
38
+ kiwisolver==1.3.1
39
+ libtpu-nightly==0.1.dev20210615
40
+ markdown==3.3.4
41
+ matplotlib==3.4.2
42
+ msgpack==1.0.2
43
+ multidict==5.1.0
44
+ multiprocess==0.70.12.2
45
+ numpy==1.19.5
46
+ oauthlib==3.1.1
47
+ opt-einsum==3.3.0
48
+ optax==0.0.9
49
+ packaging==21.0
50
+ pandas==1.3.0
51
+ pathtools==0.1.2
52
+ pillow==8.3.1
53
+ pip==20.0.2
54
+ pkg-resources==0.0.0
55
+ promise==2.3
56
+ protobuf==3.17.3
57
+ psutil==5.8.0
58
+ pyarrow==4.0.1
59
+ pyasn1-modules==0.2.8
60
+ pyasn1==0.4.8
61
+ pyparsing==2.4.7
62
+ python-dateutil==2.8.1
63
+ pytz==2021.1
64
+ pyyaml==5.4.1
65
+ regex==2021.7.6
66
+ requests-oauthlib==1.3.0
67
+ requests==2.26.0
68
+ rsa==4.7.2
69
+ sacremoses==0.0.45
70
+ scipy==1.7.0
71
+ sentry-sdk==1.3.0
72
+ setuptools==44.0.0
73
+ shortuuid==1.0.1
74
+ six==1.15.0
75
+ smmap==4.0.0
76
+ subprocess32==3.5.4
77
+ tensorboard-data-server==0.6.1
78
+ tensorboard-plugin-wit==1.8.0
79
+ tensorboard==2.5.0
80
+ tensorflow-estimator==2.5.0
81
+ tensorflow==2.5.0
82
+ termcolor==1.1.0
83
+ tokenizers==0.10.3
84
+ toolz==0.11.1
85
+ torch==1.9.0
86
+ tqdm==4.61.2
87
+ transformers==4.9.0.dev0
88
+ typing-extensions==3.7.4.3
89
+ urllib3==1.26.6
90
+ wandb==0.10.33
91
+ werkzeug==2.0.1
92
+ wheel==0.36.2
93
+ wrapt==1.12.1
94
+ xxhash==2.0.2
95
+ yarl==1.6.3
wandb/run-20210716_005946-3bte92ft/files/wandb-metadata.json ADDED
@@ -0,0 +1,45 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "os": "Linux-5.4.0-1043-gcp-x86_64-with-glibc2.29",
3
+ "python": "3.8.10",
4
+ "heartbeatAt": "2021-07-16T00:59:48.465389",
5
+ "startedAt": "2021-07-16T00:59:46.395439",
6
+ "docker": null,
7
+ "cpu_count": 96,
8
+ "cuda": null,
9
+ "args": [
10
+ "--push_to_hub",
11
+ "--output_dir=./",
12
+ "--model_type=big_bird",
13
+ "--config_name=./",
14
+ "--tokenizer_name=./",
15
+ "--max_seq_length=4096",
16
+ "--weight_decay=0.0095",
17
+ "--warmup_steps=10000",
18
+ "--overwrite_output_dir",
19
+ "--adam_beta1=0.9",
20
+ "--adam_beta2=0.98",
21
+ "--logging_steps=50",
22
+ "--eval_steps=6000",
23
+ "--num_train_epochs=3",
24
+ "--preprocessing_num_workers=96",
25
+ "--save_steps=15000",
26
+ "--learning_rate=3e-5",
27
+ "--per_device_train_batch_size=1",
28
+ "--per_device_eval_batch_size=1",
29
+ "--save_total_limit=20",
30
+ "--max_eval_samples=4000",
31
+ "--resume_from_checkpoint=./"
32
+ ],
33
+ "state": "running",
34
+ "program": "./run_mlm_flax_no_accum.py",
35
+ "codePath": "run_mlm_flax_no_accum.py",
36
+ "git": {
37
+ "remote": "https://huggingface.co/flax-community/pino-roberta-base",
38
+ "commit": "d8a2b47859c5144d1e156d0c91575425e87ee087"
39
+ },
40
+ "email": null,
41
+ "root": "/home/dat/pino-roberta-base",
42
+ "host": "t1v-n-f5c06ea1-w-0",
43
+ "username": "dat",
44
+ "executable": "/home/dat/pino/bin/python"
45
+ }
wandb/run-20210716_005946-3bte92ft/files/wandb-summary.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"training_step": 165000, "learning_rate": 2.556423714850098e-05, "train_loss": 2.123889923095703, "_runtime": 6771, "_timestamp": 1626403957, "_step": 301, "eval_step": 162000, "eval_accuracy": 0.5958945751190186, "eval_loss": 2.1219091415405273}
wandb/run-20210716_005946-3bte92ft/logs/debug-internal.log ADDED
The diff for this file is too large to render. See raw diff
 
wandb/run-20210716_005946-3bte92ft/logs/debug.log ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 2021-07-16 00:59:46,396 INFO MainThread:760449 [wandb_setup.py:_flush():69] setting env: {}
2
+ 2021-07-16 00:59:46,397 INFO MainThread:760449 [wandb_setup.py:_flush():69] setting login settings: {}
3
+ 2021-07-16 00:59:46,397 INFO MainThread:760449 [wandb_init.py:_log_setup():337] Logging user logs to /home/dat/pino-roberta-base/wandb/run-20210716_005946-3bte92ft/logs/debug.log
4
+ 2021-07-16 00:59:46,397 INFO MainThread:760449 [wandb_init.py:_log_setup():338] Logging internal logs to /home/dat/pino-roberta-base/wandb/run-20210716_005946-3bte92ft/logs/debug-internal.log
5
+ 2021-07-16 00:59:46,397 INFO MainThread:760449 [wandb_init.py:init():370] calling init triggers
6
+ 2021-07-16 00:59:46,397 INFO MainThread:760449 [wandb_init.py:init():375] wandb.init called with sweep_config: {}
7
+ config: {}
8
+ 2021-07-16 00:59:46,397 INFO MainThread:760449 [wandb_init.py:init():419] starting backend
9
+ 2021-07-16 00:59:46,397 INFO MainThread:760449 [backend.py:_multiprocessing_setup():70] multiprocessing start_methods=fork,spawn,forkserver, using: spawn
10
+ 2021-07-16 00:59:46,448 INFO MainThread:760449 [backend.py:ensure_launched():135] starting backend process...
11
+ 2021-07-16 00:59:46,499 INFO MainThread:760449 [backend.py:ensure_launched():139] started backend process with pid: 761704
12
+ 2021-07-16 00:59:46,501 INFO MainThread:760449 [wandb_init.py:init():424] backend started and connected
13
+ 2021-07-16 00:59:46,505 INFO MainThread:760449 [wandb_init.py:init():472] updated telemetry
14
+ 2021-07-16 00:59:46,506 INFO MainThread:760449 [wandb_init.py:init():491] communicating current version
15
+ 2021-07-16 00:59:47,160 INFO MainThread:760449 [wandb_init.py:init():496] got version response upgrade_message: "wandb version 0.11.0 is available! To upgrade, please run:\n $ pip install wandb --upgrade"
16
+
17
+ 2021-07-16 00:59:47,160 INFO MainThread:760449 [wandb_init.py:init():504] communicating run to backend with 30 second timeout
18
+ 2021-07-16 00:59:47,331 INFO MainThread:760449 [wandb_init.py:init():529] starting run threads in backend
19
+ 2021-07-16 00:59:48,508 INFO MainThread:760449 [wandb_run.py:_console_start():1623] atexit reg
20
+ 2021-07-16 00:59:48,509 INFO MainThread:760449 [wandb_run.py:_redirect():1497] redirect: SettingsConsole.REDIRECT
21
+ 2021-07-16 00:59:48,510 INFO MainThread:760449 [wandb_run.py:_redirect():1502] Redirecting console.
22
+ 2021-07-16 00:59:48,512 INFO MainThread:760449 [wandb_run.py:_redirect():1558] Redirects installed.
23
+ 2021-07-16 00:59:48,512 INFO MainThread:760449 [wandb_init.py:init():554] run started, returning control to user process
24
+ 2021-07-16 00:59:48,518 INFO MainThread:760449 [wandb_run.py:_config_callback():872] config_cb None None {'output_dir': './', 'overwrite_output_dir': True, 'do_train': False, 'do_eval': False, 'do_predict': False, 'evaluation_strategy': 'IntervalStrategy.NO', 'prediction_loss_only': False, 'per_device_train_batch_size': 1, 'per_device_eval_batch_size': 1, 'per_gpu_train_batch_size': None, 'per_gpu_eval_batch_size': None, 'gradient_accumulation_steps': 1, 'eval_accumulation_steps': None, 'learning_rate': 3e-05, 'weight_decay': 0.0095, 'adam_beta1': 0.9, 'adam_beta2': 0.98, 'adam_epsilon': 1e-08, 'max_grad_norm': 1.0, 'num_train_epochs': 3.0, 'max_steps': -1, 'lr_scheduler_type': 'SchedulerType.LINEAR', 'warmup_ratio': 0.0, 'warmup_steps': 10000, 'log_level': -1, 'log_level_replica': -1, 'log_on_each_node': True, 'logging_dir': './runs/Jul16_00-59-37_t1v-n-f5c06ea1-w-0', 'logging_strategy': 'IntervalStrategy.STEPS', 'logging_first_step': False, 'logging_steps': 50, 'save_strategy': 'IntervalStrategy.STEPS', 'save_steps': 15000, 'save_total_limit': 20, 'save_on_each_node': False, 'no_cuda': False, 'seed': 42, 'fp16': False, 'fp16_opt_level': 'O1', 'fp16_backend': 'auto', 'fp16_full_eval': False, 'local_rank': -1, 'tpu_num_cores': None, 'tpu_metrics_debug': False, 'debug': [], 'dataloader_drop_last': False, 'eval_steps': 6000, 'dataloader_num_workers': 0, 'past_index': -1, 'run_name': './', 'disable_tqdm': False, 'remove_unused_columns': True, 'label_names': None, 'load_best_model_at_end': False, 'metric_for_best_model': None, 'greater_is_better': None, 'ignore_data_skip': False, 'sharded_ddp': [], 'deepspeed': None, 'label_smoothing_factor': 0.0, 'adafactor': False, 'group_by_length': False, 'length_column_name': 'length', 'report_to': ['tensorboard', 'wandb'], 'ddp_find_unused_parameters': None, 'dataloader_pin_memory': True, 'skip_memory_metrics': True, 'use_legacy_prediction_loop': False, 'push_to_hub': True, 'resume_from_checkpoint': './', 'push_to_hub_model_id': '', 'push_to_hub_organization': None, 'push_to_hub_token': None, 'mp_parameters': '', '_n_gpu': 0, '__cached__setup_devices': 'cpu'}
25
+ 2021-07-16 00:59:48,520 INFO MainThread:760449 [wandb_run.py:_config_callback():872] config_cb None None {'model_name_or_path': None, 'model_type': 'big_bird', 'config_name': './', 'tokenizer_name': './', 'cache_dir': None, 'use_fast_tokenizer': True, 'dtype': 'float32'}
26
+ 2021-07-16 00:59:48,521 INFO MainThread:760449 [wandb_run.py:_config_callback():872] config_cb None None {'dataset_name': None, 'dataset_config_name': None, 'train_ref_file': None, 'validation_ref_file': None, 'overwrite_cache': False, 'validation_split_percentage': 5, 'max_seq_length': 4096, 'preprocessing_num_workers': 96, 'mlm_probability': 0.15, 'pad_to_max_length': False, 'line_by_line': False, 'max_eval_samples': 4000}
wandb/run-20210716_005946-3bte92ft/run-3bte92ft.wandb ADDED
Binary file (594 kB). View file