sanchit-gandhi HF staff commited on Apr 5, 2022

Commit

cac475f

•

1 Parent(s): c09faa6

Saving weights and logs of epoch 0

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +1 -0
.ipynb_checkpoints/create_model-checkpoint.py +29 -0
config.json +277 -0
events.out.tfevents.1649095813.t1v-n-4eb331dd-w-0.1239999.0.v2 +3 -0
events.out.tfevents.1649095849.t1v-n-4eb331dd-w-0.1241191.0.v2 +3 -0
events.out.tfevents.1649095884.t1v-n-4eb331dd-w-0.1242310.0.v2 +3 -0
events.out.tfevents.1649095921.t1v-n-4eb331dd-w-0.1243418.0.v2 +3 -0
events.out.tfevents.1649095961.t1v-n-4eb331dd-w-0.1244535.0.v2 +3 -0
events.out.tfevents.1649192648.t1v-n-4eb331dd-w-0.1449582.0.v2 +3 -0
flax_model.msgpack +3 -0
merges.txt +0 -0
preprocessor_config.json +9 -0
run_librispeech.sh +4 -4
special_tokens_map.json +1 -0
sweep.yaml +65 -0
tokenizer.json +0 -0
tokenizer_config.json +1 -0
vocab.json +0 -0
wandb/debug-cli.log +147 -0
wandb/debug-internal.log +1 -0
wandb/debug.log +1 -0
wandb/latest-run +1 -0
wandb/run-20220404_180947-p4wqexfj/files/config.yaml +108 -0
wandb/run-20220404_180947-p4wqexfj/files/output.log +788 -0
wandb/run-20220404_180947-p4wqexfj/files/requirements.txt +177 -0
wandb/run-20220404_180947-p4wqexfj/files/wandb-metadata.json +53 -0
wandb/run-20220404_180947-p4wqexfj/files/wandb-summary.json +1 -0
wandb/run-20220404_180947-p4wqexfj/logs/debug-internal.log +148 -0
wandb/run-20220404_180947-p4wqexfj/logs/debug.log +115 -0
wandb/run-20220404_180947-p4wqexfj/run-p4wqexfj.wandb +0 -0
wandb/run-20220404_181027-mgg9caus/files/config.yaml +108 -0
wandb/run-20220404_181027-mgg9caus/files/output.log +793 -0
wandb/run-20220404_181027-mgg9caus/files/requirements.txt +177 -0
wandb/run-20220404_181027-mgg9caus/files/wandb-metadata.json +53 -0
wandb/run-20220404_181027-mgg9caus/files/wandb-summary.json +1 -0
wandb/run-20220404_181027-mgg9caus/logs/debug-internal.log +144 -0
wandb/run-20220404_181027-mgg9caus/logs/debug.log +107 -0
wandb/run-20220404_181027-mgg9caus/run-mgg9caus.wandb +0 -0
wandb/run-20220404_181103-88xgr1fg/files/config.yaml +108 -0
wandb/run-20220404_181103-88xgr1fg/files/output.log +793 -0
wandb/run-20220404_181103-88xgr1fg/files/requirements.txt +177 -0
wandb/run-20220404_181103-88xgr1fg/files/wandb-metadata.json +53 -0
wandb/run-20220404_181103-88xgr1fg/files/wandb-summary.json +1 -0
wandb/run-20220404_181103-88xgr1fg/logs/debug-internal.log +144 -0
wandb/run-20220404_181103-88xgr1fg/logs/debug.log +107 -0
wandb/run-20220404_181103-88xgr1fg/run-88xgr1fg.wandb +0 -0
wandb/run-20220404_181139-xmgtui21/files/config.yaml +108 -0
wandb/run-20220404_181139-xmgtui21/files/output.log +793 -0
wandb/run-20220404_181139-xmgtui21/files/requirements.txt +177 -0
wandb/run-20220404_181139-xmgtui21/files/wandb-metadata.json +53 -0

.gitattributes CHANGED Viewed

@@ -26,3 +26,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+~/cache/huggingface/datasets/downloads/tmpqvtsgw_8 filter=lfs diff=lfs merge=lfs -text

.ipynb_checkpoints/create_model-checkpoint.py ADDED Viewed

	@@ -0,0 +1,29 @@

+import jax.numpy as jnp
+from transformers import AutoFeatureExtractor, AutoTokenizer, FlaxSpeechEncoderDecoderModel
+encoder_id = "facebook/wav2vec2-large-lv60"
+decoder_id = "facebook/bart-large-cnn"
+model = FlaxSpeechEncoderDecoderModel.from_encoder_decoder_pretrained(encoder_id, decoder_id, encoder_add_adapter=True, decoder_from_pt=True)
+model.config.encoder.feat_proj_dropout = 0.0
+model.config.encoder.final_dropout = 0.0
+model.config.encoder.mask_time_prob = 0.1
+model.config.decoder_start_token_id = model.config.decoder.bos_token_id
+model.config.pad_token_id = model.config.decoder.pad_token_id
+model.config.eos_token_id = model.config.decoder.eos_token_id
+model.config.max_length = 40
+model.config.num_beams = 1
+model.config.encoder.layerdrop = 0.0
+model.config.use_cache = False
+model.config.processor_class = "Wav2Vec2Processor"
+# check if generation works
+out = model.generate(jnp.ones((1, 2000)))
+model.save_pretrained("./")
+feature_extractor = AutoFeatureExtractor.from_pretrained(encoder_id)
+feature_extractor.save_pretrained("./")
+tokenizer = AutoTokenizer.from_pretrained(decoder_id)
+tokenizer.save_pretrained("./")

config.json ADDED Viewed

	@@ -0,0 +1,277 @@

+{
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",
+    "_num_labels": 3,
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}

events.out.tfevents.1649095813.t1v-n-4eb331dd-w-0.1239999.0.v2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5cb555e32fca1e9475a0b241e3bb2cba48e3ce342bbacf6f8ffd3d81c1c3f3fe
+size 40

events.out.tfevents.1649095849.t1v-n-4eb331dd-w-0.1241191.0.v2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1df2832c39a07dd1829a8818a21b3333c3c594097c21e9ed8ee9b23ad84aebe7
+size 40

events.out.tfevents.1649095884.t1v-n-4eb331dd-w-0.1242310.0.v2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c601c7f5d3f941c32a4b6039cbc59b4443019c46912052b5de5410ae93ad30f7
+size 40

events.out.tfevents.1649095921.t1v-n-4eb331dd-w-0.1243418.0.v2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fad3447b5ef3b5828834607b23370c874d292819b47deb7ae58f66c640a36cff
+size 40

events.out.tfevents.1649095961.t1v-n-4eb331dd-w-0.1244535.0.v2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:419fe92149e756478572afcd546d07e25adaf99d129c6da7ef64cc394c96cb6a
+size 40

events.out.tfevents.1649192648.t1v-n-4eb331dd-w-0.1449582.0.v2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:549a27283e51c8b5d32b4dfb3b95c7c6dfb6024b614ae828b7939926cb31bdf2
+size 40

flax_model.msgpack ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f83fca6aac012f0d8d1d7998627499ab247ce39eb6e24ea266ae1c63b2f00522
+size 2353635949

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

run_librispeech.sh CHANGED Viewed

@@ -10,16 +10,16 @@ python run_flax_speech_recognition_seq2seq.py \
         --preprocessing_num_workers="16" \
         --length_column_name="input_length" \
         --overwrite_output_dir \
-        --num_train_epochs="15" \
-        --per_device_train_batch_size="2" \
         --per_device_eval_batch_size="2" \
 	--gradient_accumulation_steps="1" \
         --logging_steps="25" \
-        --max_duration_in_seconds="15" \
         --max_target_length="64" \
         --generation_max_length="40" \
         --generation_num_beams="1" \
-        --learning_rate="3e-4" \
         --warmup_steps="500" \
         --text_column_name="text" \
         --save_total_limit="1" \

         --preprocessing_num_workers="16" \
         --length_column_name="input_length" \
         --overwrite_output_dir \
+        --num_train_epochs="10" \
+        --per_device_train_batch_size="4" \
         --per_device_eval_batch_size="2" \
 	--gradient_accumulation_steps="1" \
         --logging_steps="25" \
+        --max_duration_in_seconds="10" \
         --max_target_length="64" \
         --generation_max_length="40" \
         --generation_num_beams="1" \
+        --learning_rate="1e-4" \
         --warmup_steps="500" \
         --text_column_name="text" \
         --save_total_limit="1" \

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": false}}

sweep.yaml ADDED Viewed

	@@ -0,0 +1,65 @@

+command:
+- python3
+- ${program}
+- --overwrite_output_dir
+- --freeze_feature_encoder
+- --predict_with_generate
+- --do_lower_case
+- --do_train
+- --do_eval
+- ${args}
+method: random
+metric:
+  goal: minimize
+  name: eval/wer
+parameters:
+  dataset_cache_dir:
+    value: /home/sanchitgandhi/cache/huggingface/datasets
+  dataset_config_name:
+    value: clean
+  dataset_name:
+    value: librispeech_asr
+  eval_split_name:
+    value: validation
+  generation_max_length:
+    value: 40
+  generation_num_beams:
+    value: 1
+  gradient_accumulation_steps:
+    value: 1
+  learning_rate:
+    distribution: log_uniform
+    max: -6.9
+    min: -11.5
+  length_column_name:
+    value: input_length
+  logging_steps:
+    value: 1
+  matmul_precision:
+    value: highest
+  max_duration_in_seconds:
+    value: 15
+  max_target_length:
+    value: 64
+  model_name_or_path:
+    value: ./
+  num_train_epochs:
+    value: 5
+  output_dir:
+    value: ./
+  per_device_eval_batch_size:
+    value: 2
+  per_device_train_batch_size:
+    value: 2
+  preprocessing_num_workers:
+    value: 16
+  text_column_name:
+    value: text
+  train_split_name:
+    value: train.100
+  wandb_project:
+    value: flax-wav2vec2-2-bart-large-cnn
+  warmup_steps:
+    value: 500
+program: run_flax_speech_recognition_seq2seq.py
+project: flax-wav2vec2-2-bart-large-cnn

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"errors": "replace", "bos_token": "<s>", "eos_token": "</s>", "sep_token": "</s>", "cls_token": "<s>", "unk_token": "<unk>", "pad_token": "<pad>", "mask_token": "<mask>", "add_prefix_space": false, "trim_offsets": true, "model_max_length": 1024, "special_tokens_map_file": null, "name_or_path": "./", "tokenizer_class": "BartTokenizer"}

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

wandb/debug-cli.log ADDED Viewed

	@@ -0,0 +1,147 @@

+2022-04-04 18:09:43 INFO Running runs: []
+2022-04-04 18:09:43 INFO Agent received command: run
+2022-04-04 18:09:43 INFO Agent starting run with config:
+	dataset_cache_dir: /home/sanchitgandhi/cache/huggingface/datasets
+	dataset_config_name: clean
+	dataset_name: librispeech_asr
+	eval_split_name: validation
+	generation_max_length: 40
+	generation_num_beams: 1
+	gradient_accumulation_steps: 1
+	learning_rate: 2.565346074198426e-05
+	length_column_name: input_length
+	logging_steps: 1
+	matmul_precision: highest
+	max_duration_in_seconds: 15
+	max_target_length: 64
+	min_duration_in_seconds: 15
+	model_name_or_path: ./
+	num_train_epochs: 5
+	output_dir: ./
+	per_device_eval_batch_size: 2
+	per_device_train_batch_size: 2
+	preprocessing_num_workers: 16
+	text_column_name: text
+	train_split_name: train.100
+	wandb_project: flax-wav2vec2-2-bart-large-cnn
+	warmup_steps: 500
+2022-04-04 18:09:43 INFO About to run command: python3 run_flax_speech_recognition_seq2seq.py --overwrite_output_dir --freeze_feature_encoder --predict_with_generate --do_lower_case --do_train --do_eval --dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets --dataset_config_name=clean --dataset_name=librispeech_asr --eval_split_name=validation --generation_max_length=40 --generation_num_beams=1 --gradient_accumulation_steps=1 --learning_rate=2.565346074198426e-05 --length_column_name=input_length --logging_steps=1 --matmul_precision=highest --max_duration_in_seconds=15 --max_target_length=64 --min_duration_in_seconds=15 --model_name_or_path=./ --num_train_epochs=5 --output_dir=./ --per_device_eval_batch_size=2 --per_device_train_batch_size=2 --preprocessing_num_workers=16 --text_column_name=text --train_split_name=train.100 --wandb_project=flax-wav2vec2-2-bart-large-cnn --warmup_steps=500
+2022-04-04 18:09:48 INFO Running runs: ['p4wqexfj']
+2022-04-04 18:10:23 INFO Cleaning up finished run: p4wqexfj
+2022-04-04 18:10:24 INFO Agent received command: run
+2022-04-04 18:10:24 INFO Agent starting run with config:
+	dataset_cache_dir: /home/sanchitgandhi/cache/huggingface/datasets
+	dataset_config_name: clean
+	dataset_name: librispeech_asr
+	eval_split_name: validation
+	generation_max_length: 40
+	generation_num_beams: 1
+	gradient_accumulation_steps: 1
+	learning_rate: 0.0006871268347239357
+	length_column_name: input_length
+	logging_steps: 1
+	matmul_precision: highest
+	max_duration_in_seconds: 15
+	max_target_length: 64
+	min_duration_in_seconds: 15
+	model_name_or_path: ./
+	num_train_epochs: 5
+	output_dir: ./
+	per_device_eval_batch_size: 2
+	per_device_train_batch_size: 2
+	preprocessing_num_workers: 16
+	text_column_name: text
+	train_split_name: train.100
+	wandb_project: flax-wav2vec2-2-bart-large-cnn
+	warmup_steps: 500
+2022-04-04 18:10:24 INFO About to run command: python3 run_flax_speech_recognition_seq2seq.py --overwrite_output_dir --freeze_feature_encoder --predict_with_generate --do_lower_case --do_train --do_eval --dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets --dataset_config_name=clean --dataset_name=librispeech_asr --eval_split_name=validation --generation_max_length=40 --generation_num_beams=1 --gradient_accumulation_steps=1 --learning_rate=0.0006871268347239357 --length_column_name=input_length --logging_steps=1 --matmul_precision=highest --max_duration_in_seconds=15 --max_target_length=64 --min_duration_in_seconds=15 --model_name_or_path=./ --num_train_epochs=5 --output_dir=./ --per_device_eval_batch_size=2 --per_device_train_batch_size=2 --preprocessing_num_workers=16 --text_column_name=text --train_split_name=train.100 --wandb_project=flax-wav2vec2-2-bart-large-cnn --warmup_steps=500
+2022-04-04 18:10:29 INFO Running runs: ['mgg9caus']
+2022-04-04 18:10:59 INFO Cleaning up finished run: mgg9caus
+2022-04-04 18:10:59 INFO Agent received command: run
+2022-04-04 18:10:59 INFO Agent starting run with config:
+	dataset_cache_dir: /home/sanchitgandhi/cache/huggingface/datasets
+	dataset_config_name: clean
+	dataset_name: librispeech_asr
+	eval_split_name: validation
+	generation_max_length: 40
+	generation_num_beams: 1
+	gradient_accumulation_steps: 1
+	learning_rate: 9.383495031304748e-05
+	length_column_name: input_length
+	logging_steps: 1
+	matmul_precision: highest
+	max_duration_in_seconds: 15
+	max_target_length: 64
+	min_duration_in_seconds: 15
+	model_name_or_path: ./
+	num_train_epochs: 5
+	output_dir: ./
+	per_device_eval_batch_size: 2
+	per_device_train_batch_size: 2
+	preprocessing_num_workers: 16
+	text_column_name: text
+	train_split_name: train.100
+	wandb_project: flax-wav2vec2-2-bart-large-cnn
+	warmup_steps: 500
+2022-04-04 18:10:59 INFO About to run command: python3 run_flax_speech_recognition_seq2seq.py --overwrite_output_dir --freeze_feature_encoder --predict_with_generate --do_lower_case --do_train --do_eval --dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets --dataset_config_name=clean --dataset_name=librispeech_asr --eval_split_name=validation --generation_max_length=40 --generation_num_beams=1 --gradient_accumulation_steps=1 --learning_rate=9.383495031304748e-05 --length_column_name=input_length --logging_steps=1 --matmul_precision=highest --max_duration_in_seconds=15 --max_target_length=64 --min_duration_in_seconds=15 --model_name_or_path=./ --num_train_epochs=5 --output_dir=./ --per_device_eval_batch_size=2 --per_device_train_batch_size=2 --preprocessing_num_workers=16 --text_column_name=text --train_split_name=train.100 --wandb_project=flax-wav2vec2-2-bart-large-cnn --warmup_steps=500
+2022-04-04 18:11:04 INFO Running runs: ['88xgr1fg']
+2022-04-04 18:11:35 INFO Cleaning up finished run: 88xgr1fg
+2022-04-04 18:11:35 INFO Agent received command: run
+2022-04-04 18:11:35 INFO Agent starting run with config:
+	dataset_cache_dir: /home/sanchitgandhi/cache/huggingface/datasets
+	dataset_config_name: clean
+	dataset_name: librispeech_asr
+	eval_split_name: validation
+	generation_max_length: 40
+	generation_num_beams: 1
+	gradient_accumulation_steps: 1
+	learning_rate: 7.331199736432637e-05
+	length_column_name: input_length
+	logging_steps: 1
+	matmul_precision: highest
+	max_duration_in_seconds: 15
+	max_target_length: 64
+	min_duration_in_seconds: 15
+	model_name_or_path: ./
+	num_train_epochs: 5
+	output_dir: ./
+	per_device_eval_batch_size: 2
+	per_device_train_batch_size: 2
+	preprocessing_num_workers: 16
+	text_column_name: text
+	train_split_name: train.100
+	wandb_project: flax-wav2vec2-2-bart-large-cnn
+	warmup_steps: 500
+2022-04-04 18:11:35 INFO About to run command: python3 run_flax_speech_recognition_seq2seq.py --overwrite_output_dir --freeze_feature_encoder --predict_with_generate --do_lower_case --do_train --do_eval --dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets --dataset_config_name=clean --dataset_name=librispeech_asr --eval_split_name=validation --generation_max_length=40 --generation_num_beams=1 --gradient_accumulation_steps=1 --learning_rate=7.331199736432637e-05 --length_column_name=input_length --logging_steps=1 --matmul_precision=highest --max_duration_in_seconds=15 --max_target_length=64 --min_duration_in_seconds=15 --model_name_or_path=./ --num_train_epochs=5 --output_dir=./ --per_device_eval_batch_size=2 --per_device_train_batch_size=2 --preprocessing_num_workers=16 --text_column_name=text --train_split_name=train.100 --wandb_project=flax-wav2vec2-2-bart-large-cnn --warmup_steps=500
+2022-04-04 18:11:40 INFO Running runs: ['xmgtui21']
+2022-04-04 18:12:15 INFO Cleaning up finished run: xmgtui21
+2022-04-04 18:12:15 INFO Agent received command: run
+2022-04-04 18:12:15 INFO Agent starting run with config:
+	dataset_cache_dir: /home/sanchitgandhi/cache/huggingface/datasets
+	dataset_config_name: clean
+	dataset_name: librispeech_asr
+	eval_split_name: validation
+	generation_max_length: 40
+	generation_num_beams: 1
+	gradient_accumulation_steps: 1
+	learning_rate: 0.0007642424770238645
+	length_column_name: input_length
+	logging_steps: 1
+	matmul_precision: highest
+	max_duration_in_seconds: 15
+	max_target_length: 64
+	min_duration_in_seconds: 15
+	model_name_or_path: ./
+	num_train_epochs: 5
+	output_dir: ./
+	per_device_eval_batch_size: 2
+	per_device_train_batch_size: 2
+	preprocessing_num_workers: 16
+	text_column_name: text
+	train_split_name: train.100
+	wandb_project: flax-wav2vec2-2-bart-large-cnn
+	warmup_steps: 500
+2022-04-04 18:12:15 INFO About to run command: python3 run_flax_speech_recognition_seq2seq.py --overwrite_output_dir --freeze_feature_encoder --predict_with_generate --do_lower_case --do_train --do_eval --dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets --dataset_config_name=clean --dataset_name=librispeech_asr --eval_split_name=validation --generation_max_length=40 --generation_num_beams=1 --gradient_accumulation_steps=1 --learning_rate=0.0007642424770238645 --length_column_name=input_length --logging_steps=1 --matmul_precision=highest --max_duration_in_seconds=15 --max_target_length=64 --min_duration_in_seconds=15 --model_name_or_path=./ --num_train_epochs=5 --output_dir=./ --per_device_eval_batch_size=2 --per_device_train_batch_size=2 --preprocessing_num_workers=16 --text_column_name=text --train_split_name=train.100 --wandb_project=flax-wav2vec2-2-bart-large-cnn --warmup_steps=500
+2022-04-04 18:12:20 INFO Running runs: ['4s004g1k']
+2022-04-04 18:12:51 ERROR Detected 5 failed runs in a row, shutting down.
+2022-04-04 18:12:51 INFO To change this value set WANDB_AGENT_MAX_INITIAL_FAILURES=val

wandb/debug-internal.log ADDED Viewed

	@@ -0,0 +1 @@


1	+ run-20220405_210343-1w1tow7f/logs/debug-internal.log

wandb/debug.log ADDED Viewed

	@@ -0,0 +1 @@


1	+ run-20220405_210343-1w1tow7f/logs/debug.log

wandb/latest-run ADDED Viewed

	@@ -0,0 +1 @@


1	+ run-20220405_210343-1w1tow7f

wandb/run-20220404_180947-p4wqexfj/files/config.yaml ADDED Viewed

	@@ -0,0 +1,108 @@

+wandb_version: 1
+_wandb:
+  desc: null
+  value:
+    cli_version: 0.12.11
+    framework: huggingface
+    huggingface_version: 4.18.0.dev0
+    is_jupyter_run: false
+    is_kaggle_kernel: false
+    python_version: 3.8.10
+    start_time: 1649095787
+    t:
+      1:
+      - 1
+      - 2
+      - 3
+      - 11
+      - 12
+      - 45
+      - 49
+      - 51
+      2:
+      - 1
+      - 2
+      - 3
+      - 11
+      - 12
+      - 45
+      - 49
+      - 51
+      4: 3.8.10
+      5: 0.12.11
+      6: 4.18.0.dev0
+      8:
+      - 5
+dataset_cache_dir:
+  desc: null
+  value: /home/sanchitgandhi/cache/huggingface/datasets
+dataset_config_name:
+  desc: null
+  value: clean
+dataset_name:
+  desc: null
+  value: librispeech_asr
+eval_split_name:
+  desc: null
+  value: validation
+generation_max_length:
+  desc: null
+  value: 40
+generation_num_beams:
+  desc: null
+  value: 1
+gradient_accumulation_steps:
+  desc: null
+  value: 1
+learning_rate:
+  desc: null
+  value: 2.565346074198426e-05
+length_column_name:
+  desc: null
+  value: input_length
+logging_steps:
+  desc: null
+  value: 1
+matmul_precision:
+  desc: null
+  value: highest
+max_duration_in_seconds:
+  desc: null
+  value: 15
+max_target_length:
+  desc: null
+  value: 64
+min_duration_in_seconds:
+  desc: null
+  value: 15
+model_name_or_path:
+  desc: null
+  value: ./
+num_train_epochs:
+  desc: null
+  value: 5
+output_dir:
+  desc: null
+  value: ./
+per_device_eval_batch_size:
+  desc: null
+  value: 2
+per_device_train_batch_size:
+  desc: null
+  value: 2
+preprocessing_num_workers:
+  desc: null
+  value: 16
+text_column_name:
+  desc: null
+  value: text
+train_split_name:
+  desc: null
+  value: train.100
+wandb_project:
+  desc: null
+  value: flax-wav2vec2-2-bart-large-cnn
+warmup_steps:
+  desc: null
+  value: 500

wandb/run-20220404_180947-p4wqexfj/files/output.log ADDED Viewed

	@@ -0,0 +1,788 @@

+04/04/2022 18:09:50 - INFO - __main__ - Training/evaluation parameters FlaxSeq2SeqTrainingArguments(
+_n_gpu=0,
+adafactor=False,
+adam_beta1=0.9,
+adam_beta2=0.999,
+adam_epsilon=1e-08,
+bf16=False,
+bf16_full_eval=False,
+data_seed=None,
+dataloader_drop_last=False,
+dataloader_num_workers=0,
+dataloader_pin_memory=True,
+ddp_bucket_cap_mb=None,
+ddp_find_unused_parameters=None,
+debug=[],
+deepspeed=None,
+disable_tqdm=False,
+do_eval=True,
+do_predict=False,
+do_train=True,
+eval_accumulation_steps=None,
+eval_delay=0,
+eval_steps=None,
+evaluation_strategy=IntervalStrategy.NO,
+fp16=False,
+fp16_backend=auto,
+fp16_full_eval=False,
+fp16_opt_level=O1,
+generation_max_length=40,
+generation_num_beams=1,
+gradient_accumulation_steps=1,
+gradient_checkpointing=False,
+greater_is_better=None,
+group_by_length=False,
+half_precision_backend=auto,
+hub_model_id=None,
+hub_strategy=HubStrategy.EVERY_SAVE,
+hub_token=<HUB_TOKEN>,
+ignore_data_skip=False,
+label_names=None,
+label_smoothing_factor=0.0,
+learning_rate=2.565346074198426e-05,
+length_column_name=input_length,
+load_best_model_at_end=False,
+local_rank=-1,
+log_level=-1,
+log_level_replica=-1,
+log_on_each_node=True,
+logging_dir=./runs/Apr04_18-09-47_t1v-n-4eb331dd-w-0,
+logging_first_step=False,
+logging_nan_inf_filter=True,
+logging_steps=1,
+logging_strategy=IntervalStrategy.STEPS,
+lr_scheduler_type=SchedulerType.LINEAR,
+matmul_precision=highest,
+max_grad_norm=1.0,
+max_steps=-1,
+metric_for_best_model=None,
+mixed_precision=False,
+mp_parameters=,
+no_cuda=False,
+num_train_epochs=5.0,
+optim=OptimizerNames.ADAMW_HF,
+output_dir=./,
+overwrite_output_dir=True,
+past_index=-1,
+per_device_eval_batch_size=2,
+per_device_train_batch_size=2,
+predict_with_generate=True,
+prediction_loss_only=False,
+push_to_hub=False,
+push_to_hub_model_id=None,
+push_to_hub_organization=None,
+push_to_hub_token=<PUSH_TO_HUB_TOKEN>,
+remove_unused_columns=True,
+report_to=['tensorboard', 'wandb'],
+resume_from_checkpoint=None,
+run_name=./,
+save_on_each_node=False,
+save_steps=500,
+save_strategy=IntervalStrategy.STEPS,
+save_total_limit=None,
+seed=42,
+sharded_ddp=[],
+skip_memory_metrics=True,
+sortish_sampler=False,
+tf32=None,
+tpu_metrics_debug=False,
+tpu_num_cores=None,
+use_legacy_prediction_loop=False,
+warmup_ratio=0.0,
+warmup_steps=500,
+weight_decay=0.0,
+xpu_backend=None,
+)
+04/04/2022 18:09:50 - INFO - __main__ - JAX devices: 1, matmul precision: highest
+04/04/2022 18:09:50 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c)
+04/04/2022 18:09:51 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c)
+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",
+    "_num_labels": 3,
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+loading weights file ./flax_model.msgpack
+tcmalloc: large alloc 2353643520 bytes == 0x9c48e000 @  0x7ffb21ca1680 0x7ffb21cc2824 0x5f8a01 0x648cf1 0x5c4676 0x4f290e 0x64f718 0x5048b3 0x56b1da 0x56939a 0x5f6a13 0x50af49 0x5f3547 0x56c8cd 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x68d047 0x67e351 0x67e3cf 0x67e471 0x67e817 0x6b6fe2 0x6b736d 0x7ffb21ab30b3 0x5fa5ce
+All model checkpoint weights were used when initializing FlaxSpeechEncoderDecoderModel.
+All the weights of FlaxSpeechEncoderDecoderModel were initialized from the model checkpoint at ./.
+If your task is similar to the task the model of the checkpoint was trained on, you can already use FlaxSpeechEncoderDecoderModel for predictions without further training.
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-eb8e77ddeb6c34dc.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e19eb46cb05f7b14.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-92685008e5c09846.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-0d478bd8b093039a.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-13aa6d940e98be09.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-2d24e62de045a0c8.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-c6e972d87654db26.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-4771f1765b989007.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ab9a2fefe02761db.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-6ce32d0e344f4c06.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-1e0f4ae48a3c8b80.arrow
+04/04/2022 18:10:09 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e6f5ab8655734a9f.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-be6a3a97adc5697a.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-239fcccc5b67f7a4.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ff31cd13241c8bf3.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e8bf216b19718031.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-03ee7ff6632282a6.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-bb1b7de42a389f66.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ed92b3340af62815.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-12ce4b2b8350532d.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-75f20b5cb7b89a9d.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-69941cf3a70dde04.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-f4d0102728859e5f.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-1c0eaf46e759e04d.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-9f8c4dccc4fa8f17.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-14df38b848e61b52.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-19c662ecc5b20d66.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-3276de10dacb4963.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-111057e4500c4cc5.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-d1bf30028d638290.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cc50c08263e878fc.arrow
+04/04/2022 18:10:10 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-f1813a8ae49a67d6.arrow
+#1: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 161.70ba/s]
+#0: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 116.51ba/s]
+#2: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 163.38ba/s]
+#3: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 156.34ba/s]
+#4: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 150.68ba/s]
+#6: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 124.88ba/s]
+#5: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 118.73ba/s]
+#7: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 129.85ba/s]
+#8: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 132.48ba/s]
+#9: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 139.58ba/s]
+#11: 100%|███████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 137.78ba/s]
+#10: 100%|████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 90.63ba/s]
+#13: 100%|███████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 142.51ba/s]
+#12: 100%|███████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 106.71ba/s]
+#14: 100%|███████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 142.20ba/s]
+#15: 100%|███████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 143.37ba/s]
+#10:   0%|                                                                                        | 0/2 [00:00<?, ?ba/s]
+#11:   0%|                                                                                        | 0/2 [00:00<?, ?ba/s]
+#12:   0%|                                                                                        | 0/2 [00:00<?, ?ba/s]
+#13:   0%|                                                                                        | 0/2 [00:00<?, ?ba/s]
+#14:   0%|                                                                                        | 0/2 [00:00<?, ?ba/s]
+#10: 100%|███████████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 336.24ba/s]
+#11: 100%|███████████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 278.97ba/s]
+#12: 100%|█████████████████████��█████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 301.44ba/s]
+#13: 100%|███████████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 277.62ba/s]
+#14: 100%|███████████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 352.40ba/s]
+#15: 100%|███████████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 369.80ba/s]
+Feature extractor saved in ./preprocessor_config.json                                             | 0/1 [00:00<?, ?ba/s]
+tokenizer config file saved in ./tokenizer_config.json
+Special tokens file saved in ./special_tokens_map.json                                            | 0/1 [00:00<?, ?ba/s]
+Configuration saved in ./config.json
+loading feature extractor configuration file ./preprocessor_config.json                           | 0/1 [00:00<?, ?ba/s]
+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {                                                         | 0/1 [00:00<?, ?ba/s]
+  "_name_or_path": "./",
+  "architectures": [                                                                              | 0/1 [00:00<?, ?ba/s]
+    "SpeechEncoderDecoderModel"
+  ],   0%|                                                                                        | 0/1 [00:00<?, ?ba/s]
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",                                                   | 0/1 [00:00<?, ?ba/s]
+    "_num_labels": 3,                                                                             | 0/1 [00:00<?, ?ba/s]
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+2022-04-04 18:10:13.379554: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcuda.so.1'; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory
+2022-04-04 18:10:13.379593: W tensorflow/stream_executor/cuda/cuda_driver.cc:269] failed call to cuInit: UNKNOWN ERROR (303)
+04/04/2022 18:10:14 - INFO - __main__ - ***** Running training *****
+04/04/2022 18:10:14 - INFO - __main__ -   Num examples = 0
+04/04/2022 18:10:14 - INFO - __main__ -   Num Epochs = 5
+04/04/2022 18:10:14 - INFO - __main__ -   Instantaneous batch size per device = 2
+04/04/2022 18:10:14 - INFO - __main__ -   Num gradient accumulation steps = 1
+04/04/2022 18:10:14 - INFO - __main__ -   Total train batch size (w. parallel & distributed) = 2
+04/04/2022 18:10:14 - INFO - __main__ -   Total optimization steps = 0
+Epoch ... (1/5):   0%|                                                                            | 0/5 [00:00<?, ?it/s]
+Traceback (most recent call last):
+  File "run_flax_speech_recognition_seq2seq.py", line 1133, in <module>
+    main()
+  File "run_flax_speech_recognition_seq2seq.py", line 1050, in main
+    train_samples_idx = get_grouped_indices(vectorized_datasets["train"], batch_size_per_update, input_rng)
+  File "run_flax_speech_recognition_seq2seq.py", line 453, in get_grouped_indices
+    lengths = dataset["input_length"]
+  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1765, in __getitem__
+    return self._getitem(
+  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1749, in _getitem
+    pa_subtable = query_table(self._data, key, indices=self._indices if self._indices is not None else None)
+  File "/home/sanchitgandhi/datasets/src/datasets/formatting/formatting.py", line 491, in query_table
+    pa_subtable = _query_table_with_indices_mapping(table, key, indices=indices)
+  File "/home/sanchitgandhi/datasets/src/datasets/formatting/formatting.py", line 69, in _query_table_with_indices_mapping
+    return _query_table(table, indices.column(0).to_pylist())
+  File "/home/sanchitgandhi/datasets/src/datasets/table.py", line 343, in column
+    return self.table.column(*args, **kwargs)
+  File "pyarrow/table.pxi", line 2115, in pyarrow.lib.Table.column
+  File "pyarrow/table.pxi", line 2130, in pyarrow.lib.Table._column
+  File "pyarrow/array.pxi", line 561, in pyarrow.lib._normalize_index
+IndexError: index out of bounds

wandb/run-20220404_180947-p4wqexfj/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,177 @@

+absl-py==1.0.0
+aiohttp==3.8.1
+aiosignal==1.2.0
+anyio==3.5.0
+appdirs==1.4.4
+argon2-cffi-bindings==21.2.0
+argon2-cffi==21.3.0
+asttokens==2.0.5
+astunparse==1.6.3
+async-timeout==4.0.2
+attrs==21.4.0
+audioread==2.1.9
+babel==2.9.1
+backcall==0.2.0
+beautifulsoup4==4.10.0
+bleach==4.1.0
+cachetools==5.0.0
+certifi==2021.10.8
+cffi==1.15.0
+charset-normalizer==2.0.12
+chex==0.1.1
+click==8.1.0
+cycler==0.11.0
+datasets==2.0.1.dev0
+debugpy==1.6.0
+decorator==5.1.1
+defusedxml==0.7.1
+dill==0.3.4
+dm-tree==0.1.6
+docker-pycreds==0.4.0
+entrypoints==0.4
+executing==0.8.3
+filelock==3.6.0
+flatbuffers==2.0
+flax==0.4.1
+fonttools==4.31.2
+frozenlist==1.3.0
+fsspec==2022.2.0
+gast==0.5.3
+gitdb==4.0.9
+gitpython==3.1.27
+google-auth-oauthlib==0.4.6
+google-auth==2.6.2
+google-pasta==0.2.0
+grpcio==1.44.0
+h5py==3.6.0
+huggingface-hub==0.4.0
+idna==3.3
+importlib-metadata==4.11.3
+importlib-resources==5.6.0
+ipdb==0.13.9
+ipykernel==6.10.0
+ipython-genutils==0.2.0
+ipython==8.2.0
+jax==0.3.4
+jaxlib==0.3.2
+jedi==0.18.1
+jinja2==3.1.1
+jiwer==2.3.0
+joblib==1.1.0
+json5==0.9.6
+jsonschema==4.4.0
+jupyter-client==7.2.1
+jupyter-core==4.9.2
+jupyter-server==1.16.0
+jupyterlab-pygments==0.1.2
+jupyterlab-server==2.12.0
+jupyterlab==3.3.2
+keras-preprocessing==1.1.2
+keras==2.8.0
+kiwisolver==1.4.2
+libclang==13.0.0
+librosa==0.9.1
+libtpu-nightly==0.1.dev20220315
+llvmlite==0.38.0
+markdown==3.3.6
+markupsafe==2.1.1
+matplotlib-inline==0.1.3
+matplotlib==3.5.1
+mistune==0.8.4
+msgpack==1.0.3
+multidict==6.0.2
+multiprocess==0.70.12.2
+nbclassic==0.3.7
+nbclient==0.5.13
+nbconvert==6.4.5
+nbformat==5.2.0
+nest-asyncio==1.5.4
+notebook-shim==0.1.0
+notebook==6.4.10
+numba==0.55.1
+numpy==1.21.0
+oauthlib==3.2.0
+opt-einsum==3.3.0
+optax==0.1.1
+packaging==21.3
+pandas==1.4.1
+pandocfilters==1.5.0
+parso==0.8.3
+pathtools==0.1.2
+pexpect==4.8.0
+pickleshare==0.7.5
+pillow==9.0.1
+pip==20.0.2
+pkg-resources==0.0.0
+pooch==1.6.0
+prometheus-client==0.13.1
+promise==2.3
+prompt-toolkit==3.0.28
+protobuf==3.19.4
+psutil==5.9.0
+ptyprocess==0.7.0
+pure-eval==0.2.2
+pyarrow==7.0.0
+pyasn1-modules==0.2.8
+pyasn1==0.4.8
+pycparser==2.21
+pygments==2.11.2
+pyparsing==3.0.7
+pyrsistent==0.18.1
+python-dateutil==2.8.2
+python-levenshtein==0.12.2
+pytz==2022.1
+pyyaml==6.0
+pyzmq==22.3.0
+regex==2022.3.15
+requests-oauthlib==1.3.1
+requests==2.27.1
+resampy==0.2.2
+responses==0.18.0
+rsa==4.8
+sacremoses==0.0.49
+scikit-learn==1.0.2
+scipy==1.8.0
+send2trash==1.8.0
+sentry-sdk==1.5.8
+setproctitle==1.2.2
+setuptools==44.0.0
+shortuuid==1.0.8
+six==1.16.0
+smmap==5.0.0
+sniffio==1.2.0
+soundfile==0.10.3.post1
+soupsieve==2.3.1
+stack-data==0.2.0
+tensorboard-data-server==0.6.1
+tensorboard-plugin-wit==1.8.1
+tensorboard==2.8.0
+tensorflow-io-gcs-filesystem==0.24.0
+tensorflow==2.8.0
+termcolor==1.1.0
+terminado==0.13.3
+testpath==0.6.0
+tf-estimator-nightly==2.8.0.dev2021122109
+threadpoolctl==3.1.0
+tokenizers==0.11.6
+toml==0.10.2
+toolz==0.11.2
+torch==1.11.0+cpu
+torchaudio==0.11.0+cpu
+tornado==6.1
+tqdm==4.63.1
+traitlets==5.1.1
+transformers==4.18.0.dev0
+typing-extensions==4.1.1
+urllib3==1.26.9
+wandb==0.12.11
+wcwidth==0.2.5
+webencodings==0.5.1
+websocket-client==1.3.2
+werkzeug==2.1.0
+wheel==0.37.1
+wrapt==1.14.0
+xxhash==3.0.0
+yarl==1.7.2
+yaspin==2.1.0
+zipp==3.7.0

wandb/run-20220404_180947-p4wqexfj/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+    "os": "Linux-5.4.0-1043-gcp-x86_64-with-glibc2.29",
+    "python": "3.8.10",
+    "heartbeatAt": "2022-04-04T18:09:50.590240",
+    "startedAt": "2022-04-04T18:09:47.395313",
+    "docker": null,
+    "cpu_count": 96,
+    "cuda": null,
+    "args": [
+        "--overwrite_output_dir",
+        "--freeze_feature_encoder",
+        "--predict_with_generate",
+        "--do_lower_case",
+        "--do_train",
+        "--do_eval",
+        "--dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets",
+        "--dataset_config_name=clean",
+        "--dataset_name=librispeech_asr",
+        "--eval_split_name=validation",
+        "--generation_max_length=40",
+        "--generation_num_beams=1",
+        "--gradient_accumulation_steps=1",
+        "--learning_rate=2.565346074198426e-05",
+        "--length_column_name=input_length",
+        "--logging_steps=1",
+        "--matmul_precision=highest",
+        "--max_duration_in_seconds=15",
+        "--max_target_length=64",
+        "--min_duration_in_seconds=15",
+        "--model_name_or_path=./",
+        "--num_train_epochs=5",
+        "--output_dir=./",
+        "--per_device_eval_batch_size=2",
+        "--per_device_train_batch_size=2",
+        "--preprocessing_num_workers=16",
+        "--text_column_name=text",
+        "--train_split_name=train.100",
+        "--wandb_project=flax-wav2vec2-2-bart-large-cnn",
+        "--warmup_steps=500"
+    ],
+    "state": "running",
+    "program": "run_flax_speech_recognition_seq2seq.py",
+    "codePath": "run_flax_speech_recognition_seq2seq.py",
+    "git": {
+        "remote": "https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-cnn",
+        "commit": "c09faa6b18ac3f19251c414100acf1bad11c1b16"
+    },
+    "email": "sanchit@huggingface.co",
+    "root": "/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn",
+    "host": "t1v-n-4eb331dd-w-0",
+    "username": "sanchitgandhi",
+    "executable": "/home/sanchitgandhi/venv/bin/python3"
+}

wandb/run-20220404_180947-p4wqexfj/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"_wandb": {"runtime": 28}}

wandb/run-20220404_180947-p4wqexfj/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,148 @@

+2022-04-04 18:09:48,182 INFO    MainThread:1240464 [internal.py:wandb_internal():92] W&B internal server running at pid: 1240464, started at: 2022-04-04 18:09:48.182168
+2022-04-04 18:09:48,184 INFO    WriterThread:1240464 [datastore.py:open_for_write():77] open: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/run-p4wqexfj.wandb
+2022-04-04 18:09:48,185 DEBUG   SenderThread:1240464 [sender.py:send():235] send: header
+2022-04-04 18:09:48,186 DEBUG   SenderThread:1240464 [sender.py:send():235] send: run
+2022-04-04 18:09:48,316 INFO    SenderThread:1240464 [dir_watcher.py:__init__():169] watching files in: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files
+2022-04-04 18:09:48,316 INFO    SenderThread:1240464 [sender.py:_start_run_threads():812] run started: p4wqexfj with start time 1649095787
+2022-04-04 18:09:48,316 DEBUG   SenderThread:1240464 [sender.py:send():235] send: summary
+2022-04-04 18:09:48,317 INFO    SenderThread:1240464 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:09:48,320 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: check_version
+2022-04-04 18:09:48,320 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: check_version
+2022-04-04 18:09:48,381 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: run_start
+2022-04-04 18:09:49,318 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/wandb-summary.json
+2022-04-04 18:09:50,590 DEBUG   HandlerThread:1240464 [meta.py:__init__():37] meta init
+2022-04-04 18:09:50,590 DEBUG   HandlerThread:1240464 [meta.py:__init__():51] meta init done
+2022-04-04 18:09:50,590 DEBUG   HandlerThread:1240464 [meta.py:probe():211] probe
+2022-04-04 18:09:50,591 DEBUG   HandlerThread:1240464 [meta.py:_setup_git():201] setup git
+2022-04-04 18:09:50,622 DEBUG   HandlerThread:1240464 [meta.py:_setup_git():208] setup git done
+2022-04-04 18:09:50,623 DEBUG   HandlerThread:1240464 [meta.py:_save_pip():55] save pip
+2022-04-04 18:09:50,623 DEBUG   HandlerThread:1240464 [meta.py:_save_pip():69] save pip done
+2022-04-04 18:09:50,623 DEBUG   HandlerThread:1240464 [meta.py:probe():249] probe done
+2022-04-04 18:09:50,626 DEBUG   SenderThread:1240464 [sender.py:send():235] send: files
+2022-04-04 18:09:50,627 INFO    SenderThread:1240464 [sender.py:_save_file():947] saving file wandb-metadata.json with policy now
+2022-04-04 18:09:50,633 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: stop_status
+2022-04-04 18:09:50,633 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: stop_status
+2022-04-04 18:09:50,664 DEBUG   SenderThread:1240464 [sender.py:send():235] send: telemetry
+2022-04-04 18:09:50,908 INFO    Thread-11 :1240464 [upload_job.py:push():137] Uploaded file /tmp/tmp1c0a214pwandb/2czfbyut-wandb-metadata.json
+2022-04-04 18:09:51,331 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/wandb-metadata.json
+2022-04-04 18:09:51,331 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:09:51,332 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/requirements.txt
+2022-04-04 18:09:53,332 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:10:05,666 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: stop_status
+2022-04-04 18:10:05,667 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: stop_status
+2022-04-04 18:10:09,338 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:10:11,339 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:10:13,340 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:10:14,824 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: partial_history
+2022-04-04 18:10:14,826 DEBUG   SenderThread:1240464 [sender.py:send():235] send: telemetry
+2022-04-04 18:10:15,342 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:10:16,342 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:10:17,066 DEBUG   SenderThread:1240464 [sender.py:send():235] send: exit
+2022-04-04 18:10:17,066 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:17,066 INFO    SenderThread:1240464 [sender.py:send_exit():371] handling exit code: 1
+2022-04-04 18:10:17,067 INFO    SenderThread:1240464 [sender.py:send_exit():373] handling runtime: 28
+2022-04-04 18:10:17,067 INFO    SenderThread:1240464 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:10:17,067 INFO    SenderThread:1240464 [sender.py:send_exit():379] send defer
+2022-04-04 18:10:17,067 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:17,068 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,068 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 0
+2022-04-04 18:10:17,068 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,068 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 0
+2022-04-04 18:10:17,068 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 1
+2022-04-04 18:10:17,069 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,069 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 1
+2022-04-04 18:10:17,169 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:17,170 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,170 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 1
+2022-04-04 18:10:17,170 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 2
+2022-04-04 18:10:17,170 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:17,170 DEBUG   SenderThread:1240464 [sender.py:send():235] send: stats
+2022-04-04 18:10:17,171 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,171 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 2
+2022-04-04 18:10:17,171 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,171 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 2
+2022-04-04 18:10:17,171 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 3
+2022-04-04 18:10:17,171 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,171 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 3
+2022-04-04 18:10:17,172 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,172 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 3
+2022-04-04 18:10:17,172 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 4
+2022-04-04 18:10:17,172 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,172 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 4
+2022-04-04 18:10:17,172 DEBUG   SenderThread:1240464 [sender.py:send():235] send: summary
+2022-04-04 18:10:17,172 INFO    SenderThread:1240464 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:10:17,172 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,172 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 4
+2022-04-04 18:10:17,172 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 5
+2022-04-04 18:10:17,173 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,173 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 5
+2022-04-04 18:10:17,173 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,173 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 5
+2022-04-04 18:10:17,242 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 6
+2022-04-04 18:10:17,243 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,243 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 6
+2022-04-04 18:10:17,243 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,243 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 6
+2022-04-04 18:10:17,243 INFO    SenderThread:1240464 [dir_watcher.py:finish():283] shutting down directory watcher
+2022-04-04 18:10:17,272 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:17,342 INFO    Thread-7  :1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:10:17,343 INFO    SenderThread:1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/config.yaml
+2022-04-04 18:10:17,343 INFO    SenderThread:1240464 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/wandb-summary.json
+2022-04-04 18:10:17,343 INFO    SenderThread:1240464 [dir_watcher.py:finish():313] scan: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files
+2022-04-04 18:10:17,343 INFO    SenderThread:1240464 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/requirements.txt requirements.txt
+2022-04-04 18:10:17,343 INFO    SenderThread:1240464 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log output.log
+2022-04-04 18:10:17,344 INFO    SenderThread:1240464 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/wandb-metadata.json wandb-metadata.json
+2022-04-04 18:10:17,344 INFO    SenderThread:1240464 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/config.yaml config.yaml
+2022-04-04 18:10:17,344 INFO    SenderThread:1240464 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/wandb-summary.json wandb-summary.json
+2022-04-04 18:10:17,347 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 7
+2022-04-04 18:10:17,347 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:17,348 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,348 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 7
+2022-04-04 18:10:17,348 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,348 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 7
+2022-04-04 18:10:17,348 INFO    SenderThread:1240464 [file_pusher.py:finish():145] shutting down file pusher
+2022-04-04 18:10:17,449 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:17,449 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:17,551 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:17,551 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:17,621 INFO    Thread-12 :1240464 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/requirements.txt
+2022-04-04 18:10:17,644 INFO    Thread-14 :1240464 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/config.yaml
+2022-04-04 18:10:17,653 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:17,653 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:17,662 INFO    Thread-13 :1240464 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/output.log
+2022-04-04 18:10:17,694 INFO    Thread-15 :1240464 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/files/wandb-summary.json
+2022-04-04 18:10:17,754 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:17,755 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:17,856 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:17,856 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:17,894 INFO    Thread-6  :1240464 [sender.py:transition_state():392] send defer: 8
+2022-04-04 18:10:17,894 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:17,895 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 8
+2022-04-04 18:10:17,895 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:17,895 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 8
+2022-04-04 18:10:17,958 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:18,009 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 9
+2022-04-04 18:10:18,009 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:18,009 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:18,009 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 9
+2022-04-04 18:10:18,010 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:18,010 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 9
+2022-04-04 18:10:18,010 INFO    SenderThread:1240464 [sender.py:transition_state():392] send defer: 10
+2022-04-04 18:10:18,010 DEBUG   SenderThread:1240464 [sender.py:send():235] send: final
+2022-04-04 18:10:18,010 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:18,010 DEBUG   SenderThread:1240464 [sender.py:send():235] send: footer
+2022-04-04 18:10:18,010 INFO    HandlerThread:1240464 [handler.py:handle_request_defer():164] handle defer: 10
+2022-04-04 18:10:18,011 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:18,011 INFO    SenderThread:1240464 [sender.py:send_request_defer():388] handle sender defer: 10
+2022-04-04 18:10:18,110 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:18,111 DEBUG   SenderThread:1240464 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:18,111 INFO    SenderThread:1240464 [file_pusher.py:join():150] waiting for file pusher
+2022-04-04 18:10:18,262 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: sampled_history
+2022-04-04 18:10:18,263 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: get_summary
+2022-04-04 18:10:18,264 DEBUG   HandlerThread:1240464 [handler.py:handle_request():141] handle_request: shutdown
+2022-04-04 18:10:18,264 INFO    HandlerThread:1240464 [handler.py:finish():778] shutting down handler
+2022-04-04 18:10:19,011 INFO    WriterThread:1240464 [datastore.py:close():281] close: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/run-p4wqexfj.wandb
+2022-04-04 18:10:19,161 INFO    SenderThread:1240464 [sender.py:finish():1078] shutting down sender
+2022-04-04 18:10:19,161 INFO    SenderThread:1240464 [file_pusher.py:finish():145] shutting down file pusher
+2022-04-04 18:10:19,161 INFO    SenderThread:1240464 [file_pusher.py:join():150] waiting for file pusher
+2022-04-04 18:10:19,249 INFO    MainThread:1240464 [internal.py:handle_exit():82] Internal process exited

wandb/run-20220404_180947-p4wqexfj/logs/debug.log ADDED Viewed

	@@ -0,0 +1,115 @@

+2022-04-04 18:09:47,396 INFO    MainThread:1239999 [wandb_setup.py:_flush():75] Loading settings from /home/sanchitgandhi/.config/wandb/settings
+2022-04-04 18:09:47,396 INFO    MainThread:1239999 [wandb_setup.py:_flush():75] Loading settings from wandb/settings
+2022-04-04 18:09:47,396 INFO    MainThread:1239999 [wandb_setup.py:_flush():75] Loading settings from environment variables: {'entity': 'sanchit-gandhi', 'project': 'flax-wav2vec2-2-bart-large-cnn', 'sweep_id': 'a50sny4c', 'root_dir': '/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn', 'run_id': 'p4wqexfj', 'sweep_param_path': '/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/sweep-a50sny4c/config-p4wqexfj.yaml'}
+2022-04-04 18:09:47,396 INFO    MainThread:1239999 [wandb_setup.py:_flush():75] Inferring run settings from compute environment: {'program_relpath': 'run_flax_speech_recognition_seq2seq.py', 'program': 'run_flax_speech_recognition_seq2seq.py'}
+2022-04-04 18:09:47,397 INFO    MainThread:1239999 [wandb_init.py:_log_setup():405] Logging user logs to /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/logs/debug.log
+2022-04-04 18:09:47,397 INFO    MainThread:1239999 [wandb_init.py:_log_setup():406] Logging internal logs to /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_180947-p4wqexfj/logs/debug-internal.log
+2022-04-04 18:09:47,397 INFO    MainThread:1239999 [wandb_init.py:init():439] calling init triggers
+2022-04-04 18:09:47,397 INFO    MainThread:1239999 [wandb_init.py:init():442] wandb.init called with sweep_config: {'dataset_cache_dir': '/home/sanchitgandhi/cache/huggingface/datasets', 'dataset_config_name': 'clean', 'dataset_name': 'librispeech_asr', 'eval_split_name': 'validation', 'generation_max_length': 40, 'generation_num_beams': 1, 'gradient_accumulation_steps': 1, 'learning_rate': 2.565346074198426e-05, 'length_column_name': 'input_length', 'logging_steps': 1, 'matmul_precision': 'highest', 'max_duration_in_seconds': 15, 'max_target_length': 64, 'min_duration_in_seconds': 15, 'model_name_or_path': './', 'num_train_epochs': 5, 'output_dir': './', 'per_device_eval_batch_size': 2, 'per_device_train_batch_size': 2, 'preprocessing_num_workers': 16, 'text_column_name': 'text', 'train_split_name': 'train.100', 'wandb_project': 'flax-wav2vec2-2-bart-large-cnn', 'warmup_steps': 500}
+config: {}
+2022-04-04 18:09:47,397 INFO    MainThread:1239999 [wandb_init.py:init():492] starting backend
+2022-04-04 18:09:47,397 INFO    MainThread:1239999 [backend.py:_multiprocessing_setup():99] multiprocessing start_methods=fork,spawn,forkserver, using: spawn
+2022-04-04 18:09:47,411 INFO    MainThread:1239999 [backend.py:ensure_launched():219] starting backend process...
+2022-04-04 18:09:47,420 INFO    MainThread:1239999 [backend.py:ensure_launched():224] started backend process with pid: 1240464
+2022-04-04 18:09:47,422 INFO    MainThread:1239999 [wandb_init.py:init():501] backend started and connected
+2022-04-04 18:09:47,429 INFO    MainThread:1239999 [wandb_run.py:_config_callback():992] config_cb None None {'dataset_cache_dir': '/home/sanchitgandhi/cache/huggingface/datasets', 'dataset_config_name': 'clean', 'dataset_name': 'librispeech_asr', 'eval_split_name': 'validation', 'generation_max_length': 40, 'generation_num_beams': 1, 'gradient_accumulation_steps': 1, 'learning_rate': 2.565346074198426e-05, 'length_column_name': 'input_length', 'logging_steps': 1, 'matmul_precision': 'highest', 'max_duration_in_seconds': 15, 'max_target_length': 64, 'min_duration_in_seconds': 15, 'model_name_or_path': './', 'num_train_epochs': 5, 'output_dir': './', 'per_device_eval_batch_size': 2, 'per_device_train_batch_size': 2, 'preprocessing_num_workers': 16, 'text_column_name': 'text', 'train_split_name': 'train.100', 'wandb_project': 'flax-wav2vec2-2-bart-large-cnn', 'warmup_steps': 500}
+2022-04-04 18:09:47,433 INFO    MainThread:1239999 [wandb_init.py:init():565] updated telemetry
+2022-04-04 18:09:47,454 INFO    MainThread:1239999 [wandb_init.py:init():596] communicating run to backend with 30 second timeout
+2022-04-04 18:09:48,319 INFO    MainThread:1239999 [wandb_run.py:_on_init():1759] communicating current version
+2022-04-04 18:09:48,379 INFO    MainThread:1239999 [wandb_run.py:_on_init():1763] got version response
+2022-04-04 18:09:48,379 INFO    MainThread:1239999 [wandb_init.py:init():625] starting run threads in backend
+2022-04-04 18:09:50,633 INFO    MainThread:1239999 [wandb_run.py:_console_start():1733] atexit reg
+2022-04-04 18:09:50,633 INFO    MainThread:1239999 [wandb_run.py:_redirect():1606] redirect: SettingsConsole.REDIRECT
+2022-04-04 18:09:50,634 INFO    MainThread:1239999 [wandb_run.py:_redirect():1611] Redirecting console.
+2022-04-04 18:09:50,636 INFO    MainThread:1239999 [wandb_run.py:_redirect():1667] Redirects installed.
+2022-04-04 18:09:50,636 INFO    MainThread:1239999 [wandb_init.py:init():664] run started, returning control to user process
+2022-04-04 18:10:14,814 INFO    MainThread:1239999 [wandb_run.py:_atexit_cleanup():1702] got exitcode: 1
+2022-04-04 18:10:14,824 INFO    MainThread:1239999 [wandb_run.py:_restore():1674] restore
+2022-04-04 18:10:17,068 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 1
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 1948
+}
+2022-04-04 18:10:17,171 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 1
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 1948
+}
+2022-04-04 18:10:17,348 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 2
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 5092
+}
+2022-04-04 18:10:17,450 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 43815
+  total_bytes: 43842
+}
+2022-04-04 18:10:17,552 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 43842
+  total_bytes: 43842
+}
+2022-04-04 18:10:17,654 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 43842
+  total_bytes: 43842
+}
+2022-04-04 18:10:17,755 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 43842
+  total_bytes: 43842
+}
+2022-04-04 18:10:17,857 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 43842
+  total_bytes: 43842
+}
+2022-04-04 18:10:18,010 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 43842
+  total_bytes: 43842
+}
+2022-04-04 18:10:18,161 INFO    MainThread:1239999 [wandb_run.py:_on_finish():1831] got exit ret: done: true
+exit_result {
+}
+file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 43842
+  total_bytes: 43842
+}
+local_info {
+}
+2022-04-04 18:10:19,745 INFO    MainThread:1239999 [wandb_run.py:_footer_history_summary_info():2865] rendering history
+2022-04-04 18:10:19,745 INFO    MainThread:1239999 [wandb_run.py:_footer_history_summary_info():2894] rendering summary
+2022-04-04 18:10:19,748 INFO    MainThread:1239999 [wandb_run.py:_footer_sync_info():2822] logging synced files

wandb/run-20220404_180947-p4wqexfj/run-p4wqexfj.wandb ADDED Viewed

Binary file (39 kB). View file

wandb/run-20220404_181027-mgg9caus/files/config.yaml ADDED Viewed

	@@ -0,0 +1,108 @@

+wandb_version: 1
+_wandb:
+  desc: null
+  value:
+    cli_version: 0.12.11
+    framework: huggingface
+    huggingface_version: 4.18.0.dev0
+    is_jupyter_run: false
+    is_kaggle_kernel: false
+    python_version: 3.8.10
+    start_time: 1649095827
+    t:
+      1:
+      - 1
+      - 2
+      - 3
+      - 11
+      - 12
+      - 45
+      - 49
+      - 51
+      2:
+      - 1
+      - 2
+      - 3
+      - 11
+      - 12
+      - 45
+      - 49
+      - 51
+      4: 3.8.10
+      5: 0.12.11
+      6: 4.18.0.dev0
+      8:
+      - 5
+dataset_cache_dir:
+  desc: null
+  value: /home/sanchitgandhi/cache/huggingface/datasets
+dataset_config_name:
+  desc: null
+  value: clean
+dataset_name:
+  desc: null
+  value: librispeech_asr
+eval_split_name:
+  desc: null
+  value: validation
+generation_max_length:
+  desc: null
+  value: 40
+generation_num_beams:
+  desc: null
+  value: 1
+gradient_accumulation_steps:
+  desc: null
+  value: 1
+learning_rate:
+  desc: null
+  value: 0.0006871268347239357
+length_column_name:
+  desc: null
+  value: input_length
+logging_steps:
+  desc: null
+  value: 1
+matmul_precision:
+  desc: null
+  value: highest
+max_duration_in_seconds:
+  desc: null
+  value: 15
+max_target_length:
+  desc: null
+  value: 64
+min_duration_in_seconds:
+  desc: null
+  value: 15
+model_name_or_path:
+  desc: null
+  value: ./
+num_train_epochs:
+  desc: null
+  value: 5
+output_dir:
+  desc: null
+  value: ./
+per_device_eval_batch_size:
+  desc: null
+  value: 2
+per_device_train_batch_size:
+  desc: null
+  value: 2
+preprocessing_num_workers:
+  desc: null
+  value: 16
+text_column_name:
+  desc: null
+  value: text
+train_split_name:
+  desc: null
+  value: train.100
+wandb_project:
+  desc: null
+  value: flax-wav2vec2-2-bart-large-cnn
+warmup_steps:
+  desc: null
+  value: 500

wandb/run-20220404_181027-mgg9caus/files/output.log ADDED Viewed

	@@ -0,0 +1,793 @@

+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",
+    "_num_labels": 3,
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+loading weights file ./flax_model.msgpack
+04/04/2022 18:10:31 - INFO - __main__ - Training/evaluation parameters FlaxSeq2SeqTrainingArguments(
+_n_gpu=0,
+adafactor=False,
+adam_beta1=0.9,
+adam_beta2=0.999,
+adam_epsilon=1e-08,
+bf16=False,
+bf16_full_eval=False,
+data_seed=None,
+dataloader_drop_last=False,
+dataloader_num_workers=0,
+dataloader_pin_memory=True,
+ddp_bucket_cap_mb=None,
+ddp_find_unused_parameters=None,
+debug=[],
+deepspeed=None,
+disable_tqdm=False,
+do_eval=True,
+do_predict=False,
+do_train=True,
+eval_accumulation_steps=None,
+eval_delay=0,
+eval_steps=None,
+evaluation_strategy=IntervalStrategy.NO,
+fp16=False,
+fp16_backend=auto,
+fp16_full_eval=False,
+fp16_opt_level=O1,
+generation_max_length=40,
+generation_num_beams=1,
+gradient_accumulation_steps=1,
+gradient_checkpointing=False,
+greater_is_better=None,
+group_by_length=False,
+half_precision_backend=auto,
+hub_model_id=None,
+hub_strategy=HubStrategy.EVERY_SAVE,
+hub_token=<HUB_TOKEN>,
+ignore_data_skip=False,
+label_names=None,
+label_smoothing_factor=0.0,
+learning_rate=0.0006871268347239357,
+length_column_name=input_length,
+load_best_model_at_end=False,
+local_rank=-1,
+log_level=-1,
+log_level_replica=-1,
+log_on_each_node=True,
+logging_dir=./runs/Apr04_18-10-27_t1v-n-4eb331dd-w-0,
+logging_first_step=False,
+logging_nan_inf_filter=True,
+logging_steps=1,
+logging_strategy=IntervalStrategy.STEPS,
+lr_scheduler_type=SchedulerType.LINEAR,
+matmul_precision=highest,
+max_grad_norm=1.0,
+max_steps=-1,
+metric_for_best_model=None,
+mixed_precision=False,
+mp_parameters=,
+no_cuda=False,
+num_train_epochs=5.0,
+optim=OptimizerNames.ADAMW_HF,
+output_dir=./,
+overwrite_output_dir=True,
+past_index=-1,
+per_device_eval_batch_size=2,
+per_device_train_batch_size=2,
+predict_with_generate=True,
+prediction_loss_only=False,
+push_to_hub=False,
+push_to_hub_model_id=None,
+push_to_hub_organization=None,
+push_to_hub_token=<PUSH_TO_HUB_TOKEN>,
+remove_unused_columns=True,
+report_to=['tensorboard', 'wandb'],
+resume_from_checkpoint=None,
+run_name=./,
+save_on_each_node=False,
+save_steps=500,
+save_strategy=IntervalStrategy.STEPS,
+save_total_limit=None,
+seed=42,
+sharded_ddp=[],
+skip_memory_metrics=True,
+sortish_sampler=False,
+tf32=None,
+tpu_metrics_debug=False,
+tpu_num_cores=None,
+use_legacy_prediction_loop=False,
+warmup_ratio=0.0,
+warmup_steps=500,
+weight_decay=0.0,
+xpu_backend=None,
+)
+04/04/2022 18:10:31 - INFO - __main__ - JAX devices: 1, matmul precision: highest
+04/04/2022 18:10:31 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c)
+04/04/2022 18:10:31 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c)
+tcmalloc: large alloc 2353643520 bytes == 0x9cd7c000 @  0x7f28e53d2680 0x7f28e53f3824 0x5f8a01 0x648cf1 0x5c4676 0x4f290e 0x64f718 0x5048b3 0x56b1da 0x56939a 0x5f6a13 0x50af49 0x5f3547 0x56c8cd 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x68d047 0x67e351 0x67e3cf 0x67e471 0x67e817 0x6b6fe2 0x6b736d 0x7f28e51e40b3 0x5fa5ce
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-eb8e77ddeb6c34dc.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e19eb46cb05f7b14.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-92685008e5c09846.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-0d478bd8b093039a.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-13aa6d940e98be09.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-2d24e62de045a0c8.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-c6e972d87654db26.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-4771f1765b989007.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ab9a2fefe02761db.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-6ce32d0e344f4c06.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-1e0f4ae48a3c8b80.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e6f5ab8655734a9f.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-be6a3a97adc5697a.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-239fcccc5b67f7a4.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ff31cd13241c8bf3.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e8bf216b19718031.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-03ee7ff6632282a6.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-bb1b7de42a389f66.arrow
+All model checkpoint weights were used when initializing FlaxSpeechEncoderDecoderModel.
+All the weights of FlaxSpeechEncoderDecoderModel were initialized from the model checkpoint at ./.
+If your task is similar to the task the model of the checkpoint was trained on, you can already use FlaxSpeechEncoderDecoderModel for predictions without further training.
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ed92b3340af62815.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-12ce4b2b8350532d.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-75f20b5cb7b89a9d.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-69941cf3a70dde04.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-f4d0102728859e5f.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-1c0eaf46e759e04d.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-9f8c4dccc4fa8f17.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-14df38b848e61b52.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-19c662ecc5b20d66.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-3276de10dacb4963.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-111057e4500c4cc5.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-d1bf30028d638290.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cc50c08263e878fc.arrow
+04/04/2022 18:10:48 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-f1813a8ae49a67d6.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00000_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00001_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00002_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00003_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00004_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00005_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00006_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00007_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00008_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00009_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00010_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00011_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00012_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00013_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00014_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00015_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00000_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00001_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00002_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00003_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00004_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00005_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00006_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00007_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00008_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00009_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00010_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00011_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00012_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00013_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00014_of_00016.arrow
+04/04/2022 18:10:49 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00015_of_00016.arrow
+04/04/2022 18:10:50 - INFO - __main__ - ***** Running training *****
+04/04/2022 18:10:50 - INFO - __main__ -   Num examples = 0
+04/04/2022 18:10:50 - INFO - __main__ -   Num Epochs = 5
+04/04/2022 18:10:50 - INFO - __main__ -   Instantaneous batch size per device = 2
+04/04/2022 18:10:50 - INFO - __main__ -   Num gradient accumulation steps = 1
+04/04/2022 18:10:50 - INFO - __main__ -   Total train batch size (w. parallel & distributed) = 2
+04/04/2022 18:10:50 - INFO - __main__ -   Total optimization steps = 0
+Feature extractor saved in ./preprocessor_config.json
+tokenizer config file saved in ./tokenizer_config.json
+Special tokens file saved in ./special_tokens_map.json
+Configuration saved in ./config.json
+loading feature extractor configuration file ./preprocessor_config.json
+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",
+    "_num_labels": 3,
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+2022-04-04 18:10:49.472551: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcuda.so.1'; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory
+2022-04-04 18:10:49.472596: W tensorflow/stream_executor/cuda/cuda_driver.cc:269] failed call to cuInit: UNKNOWN ERROR (303)
+Epoch ... (1/5):   0%|                                                                            | 0/5 [00:00<?, ?it/s]
+Traceback (most recent call last):
+  File "run_flax_speech_recognition_seq2seq.py", line 1133, in <module>
+    main()
+  File "run_flax_speech_recognition_seq2seq.py", line 1050, in main
+    train_samples_idx = get_grouped_indices(vectorized_datasets["train"], batch_size_per_update, input_rng)
+  File "run_flax_speech_recognition_seq2seq.py", line 453, in get_grouped_indices
+    lengths = dataset["input_length"]
+  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1765, in __getitem__
+    return self._getitem(
+  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1749, in _getitem
+    pa_subtable = query_table(self._data, key, indices=self._indices if self._indices is not None else None)
+  File "/home/sanchitgandhi/datasets/src/datasets/formatting/formatting.py", line 491, in query_table
+    pa_subtable = _query_table_with_indices_mapping(table, key, indices=indices)
+  File "/home/sanchitgandhi/datasets/src/datasets/formatting/formatting.py", line 69, in _query_table_with_indices_mapping
+    return _query_table(table, indices.column(0).to_pylist())
+  File "/home/sanchitgandhi/datasets/src/datasets/table.py", line 343, in column
+    return self.table.column(*args, **kwargs)
+  File "pyarrow/table.pxi", line 2115, in pyarrow.lib.Table.column
+  File "pyarrow/table.pxi", line 2130, in pyarrow.lib.Table._column
+  File "pyarrow/array.pxi", line 561, in pyarrow.lib._normalize_index
+IndexError: index out of bounds

wandb/run-20220404_181027-mgg9caus/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,177 @@

+absl-py==1.0.0
+aiohttp==3.8.1
+aiosignal==1.2.0
+anyio==3.5.0
+appdirs==1.4.4
+argon2-cffi-bindings==21.2.0
+argon2-cffi==21.3.0
+asttokens==2.0.5
+astunparse==1.6.3
+async-timeout==4.0.2
+attrs==21.4.0
+audioread==2.1.9
+babel==2.9.1
+backcall==0.2.0
+beautifulsoup4==4.10.0
+bleach==4.1.0
+cachetools==5.0.0
+certifi==2021.10.8
+cffi==1.15.0
+charset-normalizer==2.0.12
+chex==0.1.1
+click==8.1.0
+cycler==0.11.0
+datasets==2.0.1.dev0
+debugpy==1.6.0
+decorator==5.1.1
+defusedxml==0.7.1
+dill==0.3.4
+dm-tree==0.1.6
+docker-pycreds==0.4.0
+entrypoints==0.4
+executing==0.8.3
+filelock==3.6.0
+flatbuffers==2.0
+flax==0.4.1
+fonttools==4.31.2
+frozenlist==1.3.0
+fsspec==2022.2.0
+gast==0.5.3
+gitdb==4.0.9
+gitpython==3.1.27
+google-auth-oauthlib==0.4.6
+google-auth==2.6.2
+google-pasta==0.2.0
+grpcio==1.44.0
+h5py==3.6.0
+huggingface-hub==0.4.0
+idna==3.3
+importlib-metadata==4.11.3
+importlib-resources==5.6.0
+ipdb==0.13.9
+ipykernel==6.10.0
+ipython-genutils==0.2.0
+ipython==8.2.0
+jax==0.3.4
+jaxlib==0.3.2
+jedi==0.18.1
+jinja2==3.1.1
+jiwer==2.3.0
+joblib==1.1.0
+json5==0.9.6
+jsonschema==4.4.0
+jupyter-client==7.2.1
+jupyter-core==4.9.2
+jupyter-server==1.16.0
+jupyterlab-pygments==0.1.2
+jupyterlab-server==2.12.0
+jupyterlab==3.3.2
+keras-preprocessing==1.1.2
+keras==2.8.0
+kiwisolver==1.4.2
+libclang==13.0.0
+librosa==0.9.1
+libtpu-nightly==0.1.dev20220315
+llvmlite==0.38.0
+markdown==3.3.6
+markupsafe==2.1.1
+matplotlib-inline==0.1.3
+matplotlib==3.5.1
+mistune==0.8.4
+msgpack==1.0.3
+multidict==6.0.2
+multiprocess==0.70.12.2
+nbclassic==0.3.7
+nbclient==0.5.13
+nbconvert==6.4.5
+nbformat==5.2.0
+nest-asyncio==1.5.4
+notebook-shim==0.1.0
+notebook==6.4.10
+numba==0.55.1
+numpy==1.21.0
+oauthlib==3.2.0
+opt-einsum==3.3.0
+optax==0.1.1
+packaging==21.3
+pandas==1.4.1
+pandocfilters==1.5.0
+parso==0.8.3
+pathtools==0.1.2
+pexpect==4.8.0
+pickleshare==0.7.5
+pillow==9.0.1
+pip==20.0.2
+pkg-resources==0.0.0
+pooch==1.6.0
+prometheus-client==0.13.1
+promise==2.3
+prompt-toolkit==3.0.28
+protobuf==3.19.4
+psutil==5.9.0
+ptyprocess==0.7.0
+pure-eval==0.2.2
+pyarrow==7.0.0
+pyasn1-modules==0.2.8
+pyasn1==0.4.8
+pycparser==2.21
+pygments==2.11.2
+pyparsing==3.0.7
+pyrsistent==0.18.1
+python-dateutil==2.8.2
+python-levenshtein==0.12.2
+pytz==2022.1
+pyyaml==6.0
+pyzmq==22.3.0
+regex==2022.3.15
+requests-oauthlib==1.3.1
+requests==2.27.1
+resampy==0.2.2
+responses==0.18.0
+rsa==4.8
+sacremoses==0.0.49
+scikit-learn==1.0.2
+scipy==1.8.0
+send2trash==1.8.0
+sentry-sdk==1.5.8
+setproctitle==1.2.2
+setuptools==44.0.0
+shortuuid==1.0.8
+six==1.16.0
+smmap==5.0.0
+sniffio==1.2.0
+soundfile==0.10.3.post1
+soupsieve==2.3.1
+stack-data==0.2.0
+tensorboard-data-server==0.6.1
+tensorboard-plugin-wit==1.8.1
+tensorboard==2.8.0
+tensorflow-io-gcs-filesystem==0.24.0
+tensorflow==2.8.0
+termcolor==1.1.0
+terminado==0.13.3
+testpath==0.6.0
+tf-estimator-nightly==2.8.0.dev2021122109
+threadpoolctl==3.1.0
+tokenizers==0.11.6
+toml==0.10.2
+toolz==0.11.2
+torch==1.11.0+cpu
+torchaudio==0.11.0+cpu
+tornado==6.1
+tqdm==4.63.1
+traitlets==5.1.1
+transformers==4.18.0.dev0
+typing-extensions==4.1.1
+urllib3==1.26.9
+wandb==0.12.11
+wcwidth==0.2.5
+webencodings==0.5.1
+websocket-client==1.3.2
+werkzeug==2.1.0
+wheel==0.37.1
+wrapt==1.14.0
+xxhash==3.0.0
+yarl==1.7.2
+yaspin==2.1.0
+zipp==3.7.0

wandb/run-20220404_181027-mgg9caus/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+    "os": "Linux-5.4.0-1043-gcp-x86_64-with-glibc2.29",
+    "python": "3.8.10",
+    "heartbeatAt": "2022-04-04T18:10:31.051842",
+    "startedAt": "2022-04-04T18:10:27.961456",
+    "docker": null,
+    "cpu_count": 96,
+    "cuda": null,
+    "args": [
+        "--overwrite_output_dir",
+        "--freeze_feature_encoder",
+        "--predict_with_generate",
+        "--do_lower_case",
+        "--do_train",
+        "--do_eval",
+        "--dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets",
+        "--dataset_config_name=clean",
+        "--dataset_name=librispeech_asr",
+        "--eval_split_name=validation",
+        "--generation_max_length=40",
+        "--generation_num_beams=1",
+        "--gradient_accumulation_steps=1",
+        "--learning_rate=0.0006871268347239357",
+        "--length_column_name=input_length",
+        "--logging_steps=1",
+        "--matmul_precision=highest",
+        "--max_duration_in_seconds=15",
+        "--max_target_length=64",
+        "--min_duration_in_seconds=15",
+        "--model_name_or_path=./",
+        "--num_train_epochs=5",
+        "--output_dir=./",
+        "--per_device_eval_batch_size=2",
+        "--per_device_train_batch_size=2",
+        "--preprocessing_num_workers=16",
+        "--text_column_name=text",
+        "--train_split_name=train.100",
+        "--wandb_project=flax-wav2vec2-2-bart-large-cnn",
+        "--warmup_steps=500"
+    ],
+    "state": "running",
+    "program": "run_flax_speech_recognition_seq2seq.py",
+    "codePath": "run_flax_speech_recognition_seq2seq.py",
+    "git": {
+        "remote": "https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-cnn",
+        "commit": "c09faa6b18ac3f19251c414100acf1bad11c1b16"
+    },
+    "email": "sanchit@huggingface.co",
+    "root": "/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn",
+    "host": "t1v-n-4eb331dd-w-0",
+    "username": "sanchitgandhi",
+    "executable": "/home/sanchitgandhi/venv/bin/python3"
+}

wandb/run-20220404_181027-mgg9caus/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"_wandb": {"runtime": 24}}

wandb/run-20220404_181027-mgg9caus/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,144 @@

+2022-04-04 18:10:28,689 INFO    MainThread:1241646 [internal.py:wandb_internal():92] W&B internal server running at pid: 1241646, started at: 2022-04-04 18:10:28.689690
+2022-04-04 18:10:28,692 INFO    WriterThread:1241646 [datastore.py:open_for_write():77] open: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/run-mgg9caus.wandb
+2022-04-04 18:10:28,693 DEBUG   SenderThread:1241646 [sender.py:send():235] send: header
+2022-04-04 18:10:28,693 DEBUG   SenderThread:1241646 [sender.py:send():235] send: run
+2022-04-04 18:10:28,789 INFO    SenderThread:1241646 [dir_watcher.py:__init__():169] watching files in: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files
+2022-04-04 18:10:28,789 INFO    SenderThread:1241646 [sender.py:_start_run_threads():812] run started: mgg9caus with start time 1649095827
+2022-04-04 18:10:28,789 DEBUG   SenderThread:1241646 [sender.py:send():235] send: summary
+2022-04-04 18:10:28,789 INFO    SenderThread:1241646 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:10:28,793 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: check_version
+2022-04-04 18:10:28,794 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: check_version
+2022-04-04 18:10:28,854 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: run_start
+2022-04-04 18:10:29,791 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/wandb-summary.json
+2022-04-04 18:10:31,051 DEBUG   HandlerThread:1241646 [meta.py:__init__():37] meta init
+2022-04-04 18:10:31,051 DEBUG   HandlerThread:1241646 [meta.py:__init__():51] meta init done
+2022-04-04 18:10:31,051 DEBUG   HandlerThread:1241646 [meta.py:probe():211] probe
+2022-04-04 18:10:31,052 DEBUG   HandlerThread:1241646 [meta.py:_setup_git():201] setup git
+2022-04-04 18:10:31,084 DEBUG   HandlerThread:1241646 [meta.py:_setup_git():208] setup git done
+2022-04-04 18:10:31,084 DEBUG   HandlerThread:1241646 [meta.py:_save_pip():55] save pip
+2022-04-04 18:10:31,084 DEBUG   HandlerThread:1241646 [meta.py:_save_pip():69] save pip done
+2022-04-04 18:10:31,084 DEBUG   HandlerThread:1241646 [meta.py:probe():249] probe done
+2022-04-04 18:10:31,088 DEBUG   SenderThread:1241646 [sender.py:send():235] send: files
+2022-04-04 18:10:31,088 INFO    SenderThread:1241646 [sender.py:_save_file():947] saving file wandb-metadata.json with policy now
+2022-04-04 18:10:31,096 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: stop_status
+2022-04-04 18:10:31,096 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: stop_status
+2022-04-04 18:10:31,139 DEBUG   SenderThread:1241646 [sender.py:send():235] send: telemetry
+2022-04-04 18:10:31,335 INFO    Thread-11 :1241646 [upload_job.py:push():137] Uploaded file /tmp/tmpxnk1ubkiwandb/3n64l3r4-wandb-metadata.json
+2022-04-04 18:10:31,791 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/wandb-metadata.json
+2022-04-04 18:10:31,792 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/output.log
+2022-04-04 18:10:31,792 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/requirements.txt
+2022-04-04 18:10:33,792 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/output.log
+2022-04-04 18:10:46,142 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: stop_status
+2022-04-04 18:10:46,143 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: stop_status
+2022-04-04 18:10:47,800 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/output.log
+2022-04-04 18:10:49,801 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/output.log
+2022-04-04 18:10:50,725 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: partial_history
+2022-04-04 18:10:50,725 DEBUG   SenderThread:1241646 [sender.py:send():235] send: telemetry
+2022-04-04 18:10:51,801 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/output.log
+2022-04-04 18:10:53,234 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:53,234 DEBUG   SenderThread:1241646 [sender.py:send():235] send: exit
+2022-04-04 18:10:53,235 INFO    SenderThread:1241646 [sender.py:send_exit():371] handling exit code: 1
+2022-04-04 18:10:53,235 INFO    SenderThread:1241646 [sender.py:send_exit():373] handling runtime: 24
+2022-04-04 18:10:53,237 INFO    SenderThread:1241646 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:10:53,237 INFO    SenderThread:1241646 [sender.py:send_exit():379] send defer
+2022-04-04 18:10:53,237 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:53,238 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:53,238 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 0
+2022-04-04 18:10:53,238 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:53,238 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 0
+2022-04-04 18:10:53,238 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 1
+2022-04-04 18:10:53,238 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:53,238 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 1
+2022-04-04 18:10:53,321 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:53,321 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 1
+2022-04-04 18:10:53,321 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 2
+2022-04-04 18:10:53,321 DEBUG   SenderThread:1241646 [sender.py:send():235] send: stats
+2022-04-04 18:10:53,322 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:53,322 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 2
+2022-04-04 18:10:53,322 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:53,322 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 2
+2022-04-04 18:10:53,322 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 3
+2022-04-04 18:10:53,322 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:53,322 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 3
+2022-04-04 18:10:53,322 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:53,322 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 3
+2022-04-04 18:10:53,322 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 4
+2022-04-04 18:10:53,323 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:53,323 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 4
+2022-04-04 18:10:53,323 DEBUG   SenderThread:1241646 [sender.py:send():235] send: summary
+2022-04-04 18:10:53,323 INFO    SenderThread:1241646 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:10:53,324 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:53,324 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 4
+2022-04-04 18:10:53,324 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 5
+2022-04-04 18:10:53,324 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:53,324 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 5
+2022-04-04 18:10:53,324 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:53,324 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 5
+2022-04-04 18:10:53,339 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:53,392 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 6
+2022-04-04 18:10:53,392 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:53,393 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:53,393 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 6
+2022-04-04 18:10:53,393 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:53,393 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 6
+2022-04-04 18:10:53,393 INFO    SenderThread:1241646 [dir_watcher.py:finish():283] shutting down directory watcher
+2022-04-04 18:10:53,494 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:53,802 INFO    Thread-7  :1241646 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/output.log
+2022-04-04 18:10:53,803 INFO    SenderThread:1241646 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/config.yaml
+2022-04-04 18:10:53,803 INFO    SenderThread:1241646 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/wandb-summary.json
+2022-04-04 18:10:53,804 INFO    SenderThread:1241646 [dir_watcher.py:finish():313] scan: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files
+2022-04-04 18:10:53,804 INFO    SenderThread:1241646 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/requirements.txt requirements.txt
+2022-04-04 18:10:53,804 INFO    SenderThread:1241646 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/output.log output.log
+2022-04-04 18:10:53,804 INFO    SenderThread:1241646 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/wandb-metadata.json wandb-metadata.json
+2022-04-04 18:10:53,804 INFO    SenderThread:1241646 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/config.yaml config.yaml
+2022-04-04 18:10:53,804 INFO    SenderThread:1241646 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/wandb-summary.json wandb-summary.json
+2022-04-04 18:10:53,805 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 7
+2022-04-04 18:10:53,805 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:53,808 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:53,808 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 7
+2022-04-04 18:10:53,808 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:53,808 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 7
+2022-04-04 18:10:53,808 INFO    SenderThread:1241646 [file_pusher.py:finish():145] shutting down file pusher
+2022-04-04 18:10:53,907 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:53,907 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:54,008 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:54,009 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:54,056 INFO    Thread-13 :1241646 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/output.log
+2022-04-04 18:10:54,061 INFO    Thread-15 :1241646 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/wandb-summary.json
+2022-04-04 18:10:54,082 INFO    Thread-14 :1241646 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/config.yaml
+2022-04-04 18:10:54,102 INFO    Thread-12 :1241646 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/files/requirements.txt
+2022-04-04 18:10:54,110 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:54,110 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:54,212 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:54,212 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:54,303 INFO    Thread-6  :1241646 [sender.py:transition_state():392] send defer: 8
+2022-04-04 18:10:54,303 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:54,303 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 8
+2022-04-04 18:10:54,304 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:54,304 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 8
+2022-04-04 18:10:54,314 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:54,430 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 9
+2022-04-04 18:10:54,431 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:54,431 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:54,431 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 9
+2022-04-04 18:10:54,431 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:54,431 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 9
+2022-04-04 18:10:54,431 INFO    SenderThread:1241646 [sender.py:transition_state():392] send defer: 10
+2022-04-04 18:10:54,432 DEBUG   SenderThread:1241646 [sender.py:send():235] send: final
+2022-04-04 18:10:54,432 DEBUG   SenderThread:1241646 [sender.py:send():235] send: footer
+2022-04-04 18:10:54,432 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:10:54,432 INFO    HandlerThread:1241646 [handler.py:handle_request_defer():164] handle defer: 10
+2022-04-04 18:10:54,432 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:10:54,432 INFO    SenderThread:1241646 [sender.py:send_request_defer():388] handle sender defer: 10
+2022-04-04 18:10:54,532 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:10:54,532 DEBUG   SenderThread:1241646 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:10:54,533 INFO    SenderThread:1241646 [file_pusher.py:join():150] waiting for file pusher
+2022-04-04 18:10:54,686 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: sampled_history
+2022-04-04 18:10:54,687 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: get_summary
+2022-04-04 18:10:54,688 DEBUG   HandlerThread:1241646 [handler.py:handle_request():141] handle_request: shutdown
+2022-04-04 18:10:54,688 INFO    HandlerThread:1241646 [handler.py:finish():778] shutting down handler
+2022-04-04 18:10:55,432 INFO    WriterThread:1241646 [datastore.py:close():281] close: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/run-mgg9caus.wandb
+2022-04-04 18:10:55,585 INFO    SenderThread:1241646 [sender.py:finish():1078] shutting down sender
+2022-04-04 18:10:55,585 INFO    SenderThread:1241646 [file_pusher.py:finish():145] shutting down file pusher
+2022-04-04 18:10:55,585 INFO    SenderThread:1241646 [file_pusher.py:join():150] waiting for file pusher
+2022-04-04 18:10:55,587 INFO    MainThread:1241646 [internal.py:handle_exit():82] Internal process exited

wandb/run-20220404_181027-mgg9caus/logs/debug.log ADDED Viewed

	@@ -0,0 +1,107 @@

+2022-04-04 18:10:27,962 INFO    MainThread:1241191 [wandb_setup.py:_flush():75] Loading settings from /home/sanchitgandhi/.config/wandb/settings
+2022-04-04 18:10:27,962 INFO    MainThread:1241191 [wandb_setup.py:_flush():75] Loading settings from wandb/settings
+2022-04-04 18:10:27,962 INFO    MainThread:1241191 [wandb_setup.py:_flush():75] Loading settings from environment variables: {'entity': 'sanchit-gandhi', 'project': 'flax-wav2vec2-2-bart-large-cnn', 'sweep_id': 'a50sny4c', 'root_dir': '/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn', 'run_id': 'mgg9caus', 'sweep_param_path': '/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/sweep-a50sny4c/config-mgg9caus.yaml'}
+2022-04-04 18:10:27,962 INFO    MainThread:1241191 [wandb_setup.py:_flush():75] Inferring run settings from compute environment: {'program_relpath': 'run_flax_speech_recognition_seq2seq.py', 'program': 'run_flax_speech_recognition_seq2seq.py'}
+2022-04-04 18:10:27,963 INFO    MainThread:1241191 [wandb_init.py:_log_setup():405] Logging user logs to /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/logs/debug.log
+2022-04-04 18:10:27,963 INFO    MainThread:1241191 [wandb_init.py:_log_setup():406] Logging internal logs to /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181027-mgg9caus/logs/debug-internal.log
+2022-04-04 18:10:27,963 INFO    MainThread:1241191 [wandb_init.py:init():439] calling init triggers
+2022-04-04 18:10:27,963 INFO    MainThread:1241191 [wandb_init.py:init():442] wandb.init called with sweep_config: {'dataset_cache_dir': '/home/sanchitgandhi/cache/huggingface/datasets', 'dataset_config_name': 'clean', 'dataset_name': 'librispeech_asr', 'eval_split_name': 'validation', 'generation_max_length': 40, 'generation_num_beams': 1, 'gradient_accumulation_steps': 1, 'learning_rate': 0.0006871268347239357, 'length_column_name': 'input_length', 'logging_steps': 1, 'matmul_precision': 'highest', 'max_duration_in_seconds': 15, 'max_target_length': 64, 'min_duration_in_seconds': 15, 'model_name_or_path': './', 'num_train_epochs': 5, 'output_dir': './', 'per_device_eval_batch_size': 2, 'per_device_train_batch_size': 2, 'preprocessing_num_workers': 16, 'text_column_name': 'text', 'train_split_name': 'train.100', 'wandb_project': 'flax-wav2vec2-2-bart-large-cnn', 'warmup_steps': 500}
+config: {}
+2022-04-04 18:10:27,963 INFO    MainThread:1241191 [wandb_init.py:init():492] starting backend
+2022-04-04 18:10:27,963 INFO    MainThread:1241191 [backend.py:_multiprocessing_setup():99] multiprocessing start_methods=fork,spawn,forkserver, using: spawn
+2022-04-04 18:10:27,976 INFO    MainThread:1241191 [backend.py:ensure_launched():219] starting backend process...
+2022-04-04 18:10:27,984 INFO    MainThread:1241191 [backend.py:ensure_launched():224] started backend process with pid: 1241646
+2022-04-04 18:10:27,986 INFO    MainThread:1241191 [wandb_init.py:init():501] backend started and connected
+2022-04-04 18:10:27,992 INFO    MainThread:1241191 [wandb_run.py:_config_callback():992] config_cb None None {'dataset_cache_dir': '/home/sanchitgandhi/cache/huggingface/datasets', 'dataset_config_name': 'clean', 'dataset_name': 'librispeech_asr', 'eval_split_name': 'validation', 'generation_max_length': 40, 'generation_num_beams': 1, 'gradient_accumulation_steps': 1, 'learning_rate': 0.0006871268347239357, 'length_column_name': 'input_length', 'logging_steps': 1, 'matmul_precision': 'highest', 'max_duration_in_seconds': 15, 'max_target_length': 64, 'min_duration_in_seconds': 15, 'model_name_or_path': './', 'num_train_epochs': 5, 'output_dir': './', 'per_device_eval_batch_size': 2, 'per_device_train_batch_size': 2, 'preprocessing_num_workers': 16, 'text_column_name': 'text', 'train_split_name': 'train.100', 'wandb_project': 'flax-wav2vec2-2-bart-large-cnn', 'warmup_steps': 500}
+2022-04-04 18:10:27,996 INFO    MainThread:1241191 [wandb_init.py:init():565] updated telemetry
+2022-04-04 18:10:28,015 INFO    MainThread:1241191 [wandb_init.py:init():596] communicating run to backend with 30 second timeout
+2022-04-04 18:10:28,793 INFO    MainThread:1241191 [wandb_run.py:_on_init():1759] communicating current version
+2022-04-04 18:10:28,852 INFO    MainThread:1241191 [wandb_run.py:_on_init():1763] got version response
+2022-04-04 18:10:28,852 INFO    MainThread:1241191 [wandb_init.py:init():625] starting run threads in backend
+2022-04-04 18:10:31,094 INFO    MainThread:1241191 [wandb_run.py:_console_start():1733] atexit reg
+2022-04-04 18:10:31,094 INFO    MainThread:1241191 [wandb_run.py:_redirect():1606] redirect: SettingsConsole.REDIRECT
+2022-04-04 18:10:31,095 INFO    MainThread:1241191 [wandb_run.py:_redirect():1611] Redirecting console.
+2022-04-04 18:10:31,096 INFO    MainThread:1241191 [wandb_run.py:_redirect():1667] Redirects installed.
+2022-04-04 18:10:31,097 INFO    MainThread:1241191 [wandb_init.py:init():664] run started, returning control to user process
+2022-04-04 18:10:50,720 INFO    MainThread:1241191 [wandb_run.py:_atexit_cleanup():1702] got exitcode: 1
+2022-04-04 18:10:50,724 INFO    MainThread:1241191 [wandb_run.py:_restore():1674] restore
+2022-04-04 18:10:53,238 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 1
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 1948
+}
+2022-04-04 18:10:53,393 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 1
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 1948
+}
+2022-04-04 18:10:53,806 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 4
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 45265
+}
+2022-04-04 18:10:53,908 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:10:54,009 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:10:54,111 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:10:54,213 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:10:54,431 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:10:54,585 INFO    MainThread:1241191 [wandb_run.py:_on_finish():1831] got exit ret: done: true
+exit_result {
+}
+file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+local_info {
+}
+2022-04-04 18:10:56,074 INFO    MainThread:1241191 [wandb_run.py:_footer_history_summary_info():2865] rendering history
+2022-04-04 18:10:56,074 INFO    MainThread:1241191 [wandb_run.py:_footer_history_summary_info():2894] rendering summary
+2022-04-04 18:10:56,075 INFO    MainThread:1241191 [wandb_run.py:_footer_sync_info():2822] logging synced files

wandb/run-20220404_181027-mgg9caus/run-mgg9caus.wandb ADDED Viewed

Binary file (40.3 kB). View file

wandb/run-20220404_181103-88xgr1fg/files/config.yaml ADDED Viewed

	@@ -0,0 +1,108 @@

+wandb_version: 1
+_wandb:
+  desc: null
+  value:
+    cli_version: 0.12.11
+    framework: huggingface
+    huggingface_version: 4.18.0.dev0
+    is_jupyter_run: false
+    is_kaggle_kernel: false
+    python_version: 3.8.10
+    start_time: 1649095863
+    t:
+      1:
+      - 1
+      - 2
+      - 3
+      - 11
+      - 12
+      - 45
+      - 49
+      - 51
+      2:
+      - 1
+      - 2
+      - 3
+      - 11
+      - 12
+      - 45
+      - 49
+      - 51
+      4: 3.8.10
+      5: 0.12.11
+      6: 4.18.0.dev0
+      8:
+      - 5
+dataset_cache_dir:
+  desc: null
+  value: /home/sanchitgandhi/cache/huggingface/datasets
+dataset_config_name:
+  desc: null
+  value: clean
+dataset_name:
+  desc: null
+  value: librispeech_asr
+eval_split_name:
+  desc: null
+  value: validation
+generation_max_length:
+  desc: null
+  value: 40
+generation_num_beams:
+  desc: null
+  value: 1
+gradient_accumulation_steps:
+  desc: null
+  value: 1
+learning_rate:
+  desc: null
+  value: 9.383495031304748e-05
+length_column_name:
+  desc: null
+  value: input_length
+logging_steps:
+  desc: null
+  value: 1
+matmul_precision:
+  desc: null
+  value: highest
+max_duration_in_seconds:
+  desc: null
+  value: 15
+max_target_length:
+  desc: null
+  value: 64
+min_duration_in_seconds:
+  desc: null
+  value: 15
+model_name_or_path:
+  desc: null
+  value: ./
+num_train_epochs:
+  desc: null
+  value: 5
+output_dir:
+  desc: null
+  value: ./
+per_device_eval_batch_size:
+  desc: null
+  value: 2
+per_device_train_batch_size:
+  desc: null
+  value: 2
+preprocessing_num_workers:
+  desc: null
+  value: 16
+text_column_name:
+  desc: null
+  value: text
+train_split_name:
+  desc: null
+  value: train.100
+wandb_project:
+  desc: null
+  value: flax-wav2vec2-2-bart-large-cnn
+warmup_steps:
+  desc: null
+  value: 500

wandb/run-20220404_181103-88xgr1fg/files/output.log ADDED Viewed

	@@ -0,0 +1,793 @@

+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",
+    "_num_labels": 3,
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+loading weights file ./flax_model.msgpack
+04/04/2022 18:11:06 - INFO - __main__ - Training/evaluation parameters FlaxSeq2SeqTrainingArguments(
+_n_gpu=0,
+adafactor=False,
+adam_beta1=0.9,
+adam_beta2=0.999,
+adam_epsilon=1e-08,
+bf16=False,
+bf16_full_eval=False,
+data_seed=None,
+dataloader_drop_last=False,
+dataloader_num_workers=0,
+dataloader_pin_memory=True,
+ddp_bucket_cap_mb=None,
+ddp_find_unused_parameters=None,
+debug=[],
+deepspeed=None,
+disable_tqdm=False,
+do_eval=True,
+do_predict=False,
+do_train=True,
+eval_accumulation_steps=None,
+eval_delay=0,
+eval_steps=None,
+evaluation_strategy=IntervalStrategy.NO,
+fp16=False,
+fp16_backend=auto,
+fp16_full_eval=False,
+fp16_opt_level=O1,
+generation_max_length=40,
+generation_num_beams=1,
+gradient_accumulation_steps=1,
+gradient_checkpointing=False,
+greater_is_better=None,
+group_by_length=False,
+half_precision_backend=auto,
+hub_model_id=None,
+hub_strategy=HubStrategy.EVERY_SAVE,
+hub_token=<HUB_TOKEN>,
+ignore_data_skip=False,
+label_names=None,
+label_smoothing_factor=0.0,
+learning_rate=9.383495031304748e-05,
+length_column_name=input_length,
+load_best_model_at_end=False,
+local_rank=-1,
+log_level=-1,
+log_level_replica=-1,
+log_on_each_node=True,
+logging_dir=./runs/Apr04_18-11-03_t1v-n-4eb331dd-w-0,
+logging_first_step=False,
+logging_nan_inf_filter=True,
+logging_steps=1,
+logging_strategy=IntervalStrategy.STEPS,
+lr_scheduler_type=SchedulerType.LINEAR,
+matmul_precision=highest,
+max_grad_norm=1.0,
+max_steps=-1,
+metric_for_best_model=None,
+mixed_precision=False,
+mp_parameters=,
+no_cuda=False,
+num_train_epochs=5.0,
+optim=OptimizerNames.ADAMW_HF,
+output_dir=./,
+overwrite_output_dir=True,
+past_index=-1,
+per_device_eval_batch_size=2,
+per_device_train_batch_size=2,
+predict_with_generate=True,
+prediction_loss_only=False,
+push_to_hub=False,
+push_to_hub_model_id=None,
+push_to_hub_organization=None,
+push_to_hub_token=<PUSH_TO_HUB_TOKEN>,
+remove_unused_columns=True,
+report_to=['tensorboard', 'wandb'],
+resume_from_checkpoint=None,
+run_name=./,
+save_on_each_node=False,
+save_steps=500,
+save_strategy=IntervalStrategy.STEPS,
+save_total_limit=None,
+seed=42,
+sharded_ddp=[],
+skip_memory_metrics=True,
+sortish_sampler=False,
+tf32=None,
+tpu_metrics_debug=False,
+tpu_num_cores=None,
+use_legacy_prediction_loop=False,
+warmup_ratio=0.0,
+warmup_steps=500,
+weight_decay=0.0,
+xpu_backend=None,
+)
+04/04/2022 18:11:06 - INFO - __main__ - JAX devices: 1, matmul precision: highest
+04/04/2022 18:11:06 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c)
+04/04/2022 18:11:07 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c)
+tcmalloc: large alloc 2353643520 bytes == 0x9dd4e000 @  0x7fc0f868d680 0x7fc0f86ae824 0x5f8a01 0x648cf1 0x5c4676 0x4f290e 0x64f718 0x5048b3 0x56b1da 0x56939a 0x5f6a13 0x50af49 0x5f3547 0x56c8cd 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x68d047 0x67e351 0x67e3cf 0x67e471 0x67e817 0x6b6fe2 0x6b736d 0x7fc0f849f0b3 0x5fa5ce
+All model checkpoint weights were used when initializing FlaxSpeechEncoderDecoderModel.
+All the weights of FlaxSpeechEncoderDecoderModel were initialized from the model checkpoint at ./.
+If your task is similar to the task the model of the checkpoint was trained on, you can already use FlaxSpeechEncoderDecoderModel for predictions without further training.
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-eb8e77ddeb6c34dc.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e19eb46cb05f7b14.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-92685008e5c09846.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-0d478bd8b093039a.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-13aa6d940e98be09.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-2d24e62de045a0c8.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-c6e972d87654db26.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-4771f1765b989007.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ab9a2fefe02761db.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-6ce32d0e344f4c06.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-1e0f4ae48a3c8b80.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e6f5ab8655734a9f.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-be6a3a97adc5697a.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-239fcccc5b67f7a4.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ff31cd13241c8bf3.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e8bf216b19718031.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-03ee7ff6632282a6.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-bb1b7de42a389f66.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ed92b3340af62815.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-12ce4b2b8350532d.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-75f20b5cb7b89a9d.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-69941cf3a70dde04.arrow
+04/04/2022 18:11:23 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-f4d0102728859e5f.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-1c0eaf46e759e04d.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-9f8c4dccc4fa8f17.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-14df38b848e61b52.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-19c662ecc5b20d66.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-3276de10dacb4963.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-111057e4500c4cc5.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-d1bf30028d638290.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cc50c08263e878fc.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-f1813a8ae49a67d6.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00000_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00001_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00002_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00003_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00004_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00005_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00006_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00007_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00008_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00009_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00010_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00011_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00012_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00013_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00014_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00015_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00000_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00001_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00002_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00003_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00004_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00005_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00006_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00007_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00008_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00009_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00010_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00011_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00012_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00013_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00014_of_00016.arrow
+04/04/2022 18:11:24 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00015_of_00016.arrow
+04/04/2022 18:11:25 - INFO - __main__ - ***** Running training *****
+04/04/2022 18:11:25 - INFO - __main__ -   Num examples = 0
+04/04/2022 18:11:25 - INFO - __main__ -   Num Epochs = 5
+04/04/2022 18:11:25 - INFO - __main__ -   Instantaneous batch size per device = 2
+04/04/2022 18:11:25 - INFO - __main__ -   Num gradient accumulation steps = 1
+04/04/2022 18:11:25 - INFO - __main__ -   Total train batch size (w. parallel & distributed) = 2
+04/04/2022 18:11:25 - INFO - __main__ -   Total optimization steps = 0
+Feature extractor saved in ./preprocessor_config.json
+tokenizer config file saved in ./tokenizer_config.json
+Special tokens file saved in ./special_tokens_map.json
+Configuration saved in ./config.json
+loading feature extractor configuration file ./preprocessor_config.json
+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",
+    "_num_labels": 3,
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+2022-04-04 18:11:24.732185: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcuda.so.1'; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory
+2022-04-04 18:11:24.732232: W tensorflow/stream_executor/cuda/cuda_driver.cc:269] failed call to cuInit: UNKNOWN ERROR (303)
+Epoch ... (1/5):   0%|                                                                            | 0/5 [00:00<?, ?it/s]
+Traceback (most recent call last):
+  File "run_flax_speech_recognition_seq2seq.py", line 1133, in <module>
+    main()
+  File "run_flax_speech_recognition_seq2seq.py", line 1050, in main
+    train_samples_idx = get_grouped_indices(vectorized_datasets["train"], batch_size_per_update, input_rng)
+  File "run_flax_speech_recognition_seq2seq.py", line 453, in get_grouped_indices
+    lengths = dataset["input_length"]
+  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1765, in __getitem__
+    return self._getitem(
+  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1749, in _getitem
+    pa_subtable = query_table(self._data, key, indices=self._indices if self._indices is not None else None)
+  File "/home/sanchitgandhi/datasets/src/datasets/formatting/formatting.py", line 491, in query_table
+    pa_subtable = _query_table_with_indices_mapping(table, key, indices=indices)
+  File "/home/sanchitgandhi/datasets/src/datasets/formatting/formatting.py", line 69, in _query_table_with_indices_mapping
+    return _query_table(table, indices.column(0).to_pylist())
+  File "/home/sanchitgandhi/datasets/src/datasets/table.py", line 343, in column
+    return self.table.column(*args, **kwargs)
+  File "pyarrow/table.pxi", line 2115, in pyarrow.lib.Table.column
+  File "pyarrow/table.pxi", line 2130, in pyarrow.lib.Table._column
+  File "pyarrow/array.pxi", line 561, in pyarrow.lib._normalize_index
+IndexError: index out of bounds

wandb/run-20220404_181103-88xgr1fg/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,177 @@

+absl-py==1.0.0
+aiohttp==3.8.1
+aiosignal==1.2.0
+anyio==3.5.0
+appdirs==1.4.4
+argon2-cffi-bindings==21.2.0
+argon2-cffi==21.3.0
+asttokens==2.0.5
+astunparse==1.6.3
+async-timeout==4.0.2
+attrs==21.4.0
+audioread==2.1.9
+babel==2.9.1
+backcall==0.2.0
+beautifulsoup4==4.10.0
+bleach==4.1.0
+cachetools==5.0.0
+certifi==2021.10.8
+cffi==1.15.0
+charset-normalizer==2.0.12
+chex==0.1.1
+click==8.1.0
+cycler==0.11.0
+datasets==2.0.1.dev0
+debugpy==1.6.0
+decorator==5.1.1
+defusedxml==0.7.1
+dill==0.3.4
+dm-tree==0.1.6
+docker-pycreds==0.4.0
+entrypoints==0.4
+executing==0.8.3
+filelock==3.6.0
+flatbuffers==2.0
+flax==0.4.1
+fonttools==4.31.2
+frozenlist==1.3.0
+fsspec==2022.2.0
+gast==0.5.3
+gitdb==4.0.9
+gitpython==3.1.27
+google-auth-oauthlib==0.4.6
+google-auth==2.6.2
+google-pasta==0.2.0
+grpcio==1.44.0
+h5py==3.6.0
+huggingface-hub==0.4.0
+idna==3.3
+importlib-metadata==4.11.3
+importlib-resources==5.6.0
+ipdb==0.13.9
+ipykernel==6.10.0
+ipython-genutils==0.2.0
+ipython==8.2.0
+jax==0.3.4
+jaxlib==0.3.2
+jedi==0.18.1
+jinja2==3.1.1
+jiwer==2.3.0
+joblib==1.1.0
+json5==0.9.6
+jsonschema==4.4.0
+jupyter-client==7.2.1
+jupyter-core==4.9.2
+jupyter-server==1.16.0
+jupyterlab-pygments==0.1.2
+jupyterlab-server==2.12.0
+jupyterlab==3.3.2
+keras-preprocessing==1.1.2
+keras==2.8.0
+kiwisolver==1.4.2
+libclang==13.0.0
+librosa==0.9.1
+libtpu-nightly==0.1.dev20220315
+llvmlite==0.38.0
+markdown==3.3.6
+markupsafe==2.1.1
+matplotlib-inline==0.1.3
+matplotlib==3.5.1
+mistune==0.8.4
+msgpack==1.0.3
+multidict==6.0.2
+multiprocess==0.70.12.2
+nbclassic==0.3.7
+nbclient==0.5.13
+nbconvert==6.4.5
+nbformat==5.2.0
+nest-asyncio==1.5.4
+notebook-shim==0.1.0
+notebook==6.4.10
+numba==0.55.1
+numpy==1.21.0
+oauthlib==3.2.0
+opt-einsum==3.3.0
+optax==0.1.1
+packaging==21.3
+pandas==1.4.1
+pandocfilters==1.5.0
+parso==0.8.3
+pathtools==0.1.2
+pexpect==4.8.0
+pickleshare==0.7.5
+pillow==9.0.1
+pip==20.0.2
+pkg-resources==0.0.0
+pooch==1.6.0
+prometheus-client==0.13.1
+promise==2.3
+prompt-toolkit==3.0.28
+protobuf==3.19.4
+psutil==5.9.0
+ptyprocess==0.7.0
+pure-eval==0.2.2
+pyarrow==7.0.0
+pyasn1-modules==0.2.8
+pyasn1==0.4.8
+pycparser==2.21
+pygments==2.11.2
+pyparsing==3.0.7
+pyrsistent==0.18.1
+python-dateutil==2.8.2
+python-levenshtein==0.12.2
+pytz==2022.1
+pyyaml==6.0
+pyzmq==22.3.0
+regex==2022.3.15
+requests-oauthlib==1.3.1
+requests==2.27.1
+resampy==0.2.2
+responses==0.18.0
+rsa==4.8
+sacremoses==0.0.49
+scikit-learn==1.0.2
+scipy==1.8.0
+send2trash==1.8.0
+sentry-sdk==1.5.8
+setproctitle==1.2.2
+setuptools==44.0.0
+shortuuid==1.0.8
+six==1.16.0
+smmap==5.0.0
+sniffio==1.2.0
+soundfile==0.10.3.post1
+soupsieve==2.3.1
+stack-data==0.2.0
+tensorboard-data-server==0.6.1
+tensorboard-plugin-wit==1.8.1
+tensorboard==2.8.0
+tensorflow-io-gcs-filesystem==0.24.0
+tensorflow==2.8.0
+termcolor==1.1.0
+terminado==0.13.3
+testpath==0.6.0
+tf-estimator-nightly==2.8.0.dev2021122109
+threadpoolctl==3.1.0
+tokenizers==0.11.6
+toml==0.10.2
+toolz==0.11.2
+torch==1.11.0+cpu
+torchaudio==0.11.0+cpu
+tornado==6.1
+tqdm==4.63.1
+traitlets==5.1.1
+transformers==4.18.0.dev0
+typing-extensions==4.1.1
+urllib3==1.26.9
+wandb==0.12.11
+wcwidth==0.2.5
+webencodings==0.5.1
+websocket-client==1.3.2
+werkzeug==2.1.0
+wheel==0.37.1
+wrapt==1.14.0
+xxhash==3.0.0
+yarl==1.7.2
+yaspin==2.1.0
+zipp==3.7.0

wandb/run-20220404_181103-88xgr1fg/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+    "os": "Linux-5.4.0-1043-gcp-x86_64-with-glibc2.29",
+    "python": "3.8.10",
+    "heartbeatAt": "2022-04-04T18:11:06.449423",
+    "startedAt": "2022-04-04T18:11:03.361017",
+    "docker": null,
+    "cpu_count": 96,
+    "cuda": null,
+    "args": [
+        "--overwrite_output_dir",
+        "--freeze_feature_encoder",
+        "--predict_with_generate",
+        "--do_lower_case",
+        "--do_train",
+        "--do_eval",
+        "--dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets",
+        "--dataset_config_name=clean",
+        "--dataset_name=librispeech_asr",
+        "--eval_split_name=validation",
+        "--generation_max_length=40",
+        "--generation_num_beams=1",
+        "--gradient_accumulation_steps=1",
+        "--learning_rate=9.383495031304748e-05",
+        "--length_column_name=input_length",
+        "--logging_steps=1",
+        "--matmul_precision=highest",
+        "--max_duration_in_seconds=15",
+        "--max_target_length=64",
+        "--min_duration_in_seconds=15",
+        "--model_name_or_path=./",
+        "--num_train_epochs=5",
+        "--output_dir=./",
+        "--per_device_eval_batch_size=2",
+        "--per_device_train_batch_size=2",
+        "--preprocessing_num_workers=16",
+        "--text_column_name=text",
+        "--train_split_name=train.100",
+        "--wandb_project=flax-wav2vec2-2-bart-large-cnn",
+        "--warmup_steps=500"
+    ],
+    "state": "running",
+    "program": "run_flax_speech_recognition_seq2seq.py",
+    "codePath": "run_flax_speech_recognition_seq2seq.py",
+    "git": {
+        "remote": "https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-cnn",
+        "commit": "c09faa6b18ac3f19251c414100acf1bad11c1b16"
+    },
+    "email": "sanchit@huggingface.co",
+    "root": "/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn",
+    "host": "t1v-n-4eb331dd-w-0",
+    "username": "sanchitgandhi",
+    "executable": "/home/sanchitgandhi/venv/bin/python3"
+}

wandb/run-20220404_181103-88xgr1fg/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"_wandb": {"runtime": 23}}

wandb/run-20220404_181103-88xgr1fg/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,144 @@

+2022-04-04 18:11:04,131 INFO    MainThread:1242765 [internal.py:wandb_internal():92] W&B internal server running at pid: 1242765, started at: 2022-04-04 18:11:04.131243
+2022-04-04 18:11:04,133 INFO    WriterThread:1242765 [datastore.py:open_for_write():77] open: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/run-88xgr1fg.wandb
+2022-04-04 18:11:04,134 DEBUG   SenderThread:1242765 [sender.py:send():235] send: header
+2022-04-04 18:11:04,134 DEBUG   SenderThread:1242765 [sender.py:send():235] send: run
+2022-04-04 18:11:04,223 INFO    SenderThread:1242765 [dir_watcher.py:__init__():169] watching files in: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files
+2022-04-04 18:11:04,223 INFO    SenderThread:1242765 [sender.py:_start_run_threads():812] run started: 88xgr1fg with start time 1649095863
+2022-04-04 18:11:04,223 DEBUG   SenderThread:1242765 [sender.py:send():235] send: summary
+2022-04-04 18:11:04,223 INFO    SenderThread:1242765 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:11:04,226 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: check_version
+2022-04-04 18:11:04,226 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: check_version
+2022-04-04 18:11:04,286 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: run_start
+2022-04-04 18:11:05,224 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/wandb-summary.json
+2022-04-04 18:11:06,449 DEBUG   HandlerThread:1242765 [meta.py:__init__():37] meta init
+2022-04-04 18:11:06,449 DEBUG   HandlerThread:1242765 [meta.py:__init__():51] meta init done
+2022-04-04 18:11:06,449 DEBUG   HandlerThread:1242765 [meta.py:probe():211] probe
+2022-04-04 18:11:06,450 DEBUG   HandlerThread:1242765 [meta.py:_setup_git():201] setup git
+2022-04-04 18:11:06,481 DEBUG   HandlerThread:1242765 [meta.py:_setup_git():208] setup git done
+2022-04-04 18:11:06,481 DEBUG   HandlerThread:1242765 [meta.py:_save_pip():55] save pip
+2022-04-04 18:11:06,482 DEBUG   HandlerThread:1242765 [meta.py:_save_pip():69] save pip done
+2022-04-04 18:11:06,482 DEBUG   HandlerThread:1242765 [meta.py:probe():249] probe done
+2022-04-04 18:11:06,485 DEBUG   SenderThread:1242765 [sender.py:send():235] send: files
+2022-04-04 18:11:06,485 INFO    SenderThread:1242765 [sender.py:_save_file():947] saving file wandb-metadata.json with policy now
+2022-04-04 18:11:06,491 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: stop_status
+2022-04-04 18:11:06,491 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: stop_status
+2022-04-04 18:11:06,537 DEBUG   SenderThread:1242765 [sender.py:send():235] send: telemetry
+2022-04-04 18:11:06,787 INFO    Thread-11 :1242765 [upload_job.py:push():137] Uploaded file /tmp/tmpso3thk5xwandb/16y6egpg-wandb-metadata.json
+2022-04-04 18:11:07,228 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/requirements.txt
+2022-04-04 18:11:07,228 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/output.log
+2022-04-04 18:11:07,228 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_created():217] file/dir created: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/wandb-metadata.json
+2022-04-04 18:11:09,229 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/output.log
+2022-04-04 18:11:21,798 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: stop_status
+2022-04-04 18:11:21,799 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: stop_status
+2022-04-04 18:11:23,235 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/output.log
+2022-04-04 18:11:25,235 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/output.log
+2022-04-04 18:11:25,880 DEBUG   SenderThread:1242765 [sender.py:send():235] send: telemetry
+2022-04-04 18:11:25,881 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: partial_history
+2022-04-04 18:11:27,236 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/output.log
+2022-04-04 18:11:28,239 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:28,240 DEBUG   SenderThread:1242765 [sender.py:send():235] send: exit
+2022-04-04 18:11:28,240 INFO    SenderThread:1242765 [sender.py:send_exit():371] handling exit code: 1
+2022-04-04 18:11:28,240 INFO    SenderThread:1242765 [sender.py:send_exit():373] handling runtime: 23
+2022-04-04 18:11:28,240 INFO    SenderThread:1242765 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:11:28,241 INFO    SenderThread:1242765 [sender.py:send_exit():379] send defer
+2022-04-04 18:11:28,241 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:28,241 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:28,241 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 0
+2022-04-04 18:11:28,241 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:28,241 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 0
+2022-04-04 18:11:28,242 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 1
+2022-04-04 18:11:28,242 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:28,242 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 1
+2022-04-04 18:11:28,315 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:28,315 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 1
+2022-04-04 18:11:28,315 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 2
+2022-04-04 18:11:28,315 DEBUG   SenderThread:1242765 [sender.py:send():235] send: stats
+2022-04-04 18:11:28,315 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:28,315 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 2
+2022-04-04 18:11:28,316 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:28,316 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 2
+2022-04-04 18:11:28,316 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 3
+2022-04-04 18:11:28,316 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:28,316 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 3
+2022-04-04 18:11:28,316 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:28,316 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 3
+2022-04-04 18:11:28,316 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 4
+2022-04-04 18:11:28,316 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:28,316 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 4
+2022-04-04 18:11:28,316 DEBUG   SenderThread:1242765 [sender.py:send():235] send: summary
+2022-04-04 18:11:28,317 INFO    SenderThread:1242765 [sender.py:_save_file():947] saving file wandb-summary.json with policy end
+2022-04-04 18:11:28,317 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:28,317 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 4
+2022-04-04 18:11:28,317 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 5
+2022-04-04 18:11:28,317 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:28,317 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 5
+2022-04-04 18:11:28,317 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:28,317 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 5
+2022-04-04 18:11:28,342 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:28,409 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 6
+2022-04-04 18:11:28,409 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:28,409 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:28,410 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 6
+2022-04-04 18:11:28,410 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:28,410 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 6
+2022-04-04 18:11:28,410 INFO    SenderThread:1242765 [dir_watcher.py:finish():283] shutting down directory watcher
+2022-04-04 18:11:28,510 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:29,237 INFO    Thread-7  :1242765 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/config.yaml
+2022-04-04 18:11:29,237 INFO    SenderThread:1242765 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/output.log
+2022-04-04 18:11:29,238 INFO    SenderThread:1242765 [dir_watcher.py:_on_file_modified():230] file/dir modified: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/wandb-summary.json
+2022-04-04 18:11:29,238 INFO    SenderThread:1242765 [dir_watcher.py:finish():313] scan: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files
+2022-04-04 18:11:29,238 INFO    SenderThread:1242765 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/requirements.txt requirements.txt
+2022-04-04 18:11:29,238 INFO    SenderThread:1242765 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/output.log output.log
+2022-04-04 18:11:29,238 INFO    SenderThread:1242765 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/wandb-metadata.json wandb-metadata.json
+2022-04-04 18:11:29,238 INFO    SenderThread:1242765 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/config.yaml config.yaml
+2022-04-04 18:11:29,238 INFO    SenderThread:1242765 [dir_watcher.py:finish():327] scan save: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/wandb-summary.json wandb-summary.json
+2022-04-04 18:11:29,239 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 7
+2022-04-04 18:11:29,239 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:29,244 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:29,244 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 7
+2022-04-04 18:11:29,247 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:29,247 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 7
+2022-04-04 18:11:29,247 INFO    SenderThread:1242765 [file_pusher.py:finish():145] shutting down file pusher
+2022-04-04 18:11:29,348 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:29,348 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:29,450 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:29,450 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:29,477 INFO    Thread-15 :1242765 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/wandb-summary.json
+2022-04-04 18:11:29,510 INFO    Thread-13 :1242765 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/output.log
+2022-04-04 18:11:29,522 INFO    Thread-12 :1242765 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/requirements.txt
+2022-04-04 18:11:29,523 INFO    Thread-14 :1242765 [upload_job.py:push():137] Uploaded file /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/files/config.yaml
+2022-04-04 18:11:29,551 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:29,551 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:29,652 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:29,653 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:29,724 INFO    Thread-6  :1242765 [sender.py:transition_state():392] send defer: 8
+2022-04-04 18:11:29,724 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:29,724 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 8
+2022-04-04 18:11:29,724 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:29,724 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 8
+2022-04-04 18:11:29,754 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:29,830 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 9
+2022-04-04 18:11:29,830 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:29,830 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:29,830 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 9
+2022-04-04 18:11:29,831 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:29,831 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 9
+2022-04-04 18:11:29,831 INFO    SenderThread:1242765 [sender.py:transition_state():392] send defer: 10
+2022-04-04 18:11:29,831 DEBUG   SenderThread:1242765 [sender.py:send():235] send: final
+2022-04-04 18:11:29,831 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: defer
+2022-04-04 18:11:29,831 INFO    HandlerThread:1242765 [handler.py:handle_request_defer():164] handle defer: 10
+2022-04-04 18:11:29,832 DEBUG   SenderThread:1242765 [sender.py:send():235] send: footer
+2022-04-04 18:11:29,832 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: defer
+2022-04-04 18:11:29,832 INFO    SenderThread:1242765 [sender.py:send_request_defer():388] handle sender defer: 10
+2022-04-04 18:11:29,931 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: poll_exit
+2022-04-04 18:11:29,931 DEBUG   SenderThread:1242765 [sender.py:send_request():249] send_request: poll_exit
+2022-04-04 18:11:29,931 INFO    SenderThread:1242765 [file_pusher.py:join():150] waiting for file pusher
+2022-04-04 18:11:30,799 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: sampled_history
+2022-04-04 18:11:30,799 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: get_summary
+2022-04-04 18:11:30,800 DEBUG   HandlerThread:1242765 [handler.py:handle_request():141] handle_request: shutdown
+2022-04-04 18:11:30,800 INFO    HandlerThread:1242765 [handler.py:finish():778] shutting down handler
+2022-04-04 18:11:30,832 INFO    WriterThread:1242765 [datastore.py:close():281] close: /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/run-88xgr1fg.wandb
+2022-04-04 18:11:31,698 INFO    SenderThread:1242765 [sender.py:finish():1078] shutting down sender
+2022-04-04 18:11:31,698 INFO    SenderThread:1242765 [file_pusher.py:finish():145] shutting down file pusher
+2022-04-04 18:11:31,698 INFO    SenderThread:1242765 [file_pusher.py:join():150] waiting for file pusher
+2022-04-04 18:11:31,700 INFO    MainThread:1242765 [internal.py:handle_exit():82] Internal process exited

wandb/run-20220404_181103-88xgr1fg/logs/debug.log ADDED Viewed

	@@ -0,0 +1,107 @@

+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_setup.py:_flush():75] Loading settings from /home/sanchitgandhi/.config/wandb/settings
+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_setup.py:_flush():75] Loading settings from wandb/settings
+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_setup.py:_flush():75] Loading settings from environment variables: {'entity': 'sanchit-gandhi', 'project': 'flax-wav2vec2-2-bart-large-cnn', 'sweep_id': 'a50sny4c', 'root_dir': '/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn', 'run_id': '88xgr1fg', 'sweep_param_path': '/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/sweep-a50sny4c/config-88xgr1fg.yaml'}
+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_setup.py:_flush():75] Inferring run settings from compute environment: {'program_relpath': 'run_flax_speech_recognition_seq2seq.py', 'program': 'run_flax_speech_recognition_seq2seq.py'}
+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_init.py:_log_setup():405] Logging user logs to /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/logs/debug.log
+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_init.py:_log_setup():406] Logging internal logs to /home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn/wandb/run-20220404_181103-88xgr1fg/logs/debug-internal.log
+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_init.py:init():439] calling init triggers
+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_init.py:init():442] wandb.init called with sweep_config: {'dataset_cache_dir': '/home/sanchitgandhi/cache/huggingface/datasets', 'dataset_config_name': 'clean', 'dataset_name': 'librispeech_asr', 'eval_split_name': 'validation', 'generation_max_length': 40, 'generation_num_beams': 1, 'gradient_accumulation_steps': 1, 'learning_rate': 9.383495031304748e-05, 'length_column_name': 'input_length', 'logging_steps': 1, 'matmul_precision': 'highest', 'max_duration_in_seconds': 15, 'max_target_length': 64, 'min_duration_in_seconds': 15, 'model_name_or_path': './', 'num_train_epochs': 5, 'output_dir': './', 'per_device_eval_batch_size': 2, 'per_device_train_batch_size': 2, 'preprocessing_num_workers': 16, 'text_column_name': 'text', 'train_split_name': 'train.100', 'wandb_project': 'flax-wav2vec2-2-bart-large-cnn', 'warmup_steps': 500}
+config: {}
+2022-04-04 18:11:03,362 INFO    MainThread:1242310 [wandb_init.py:init():492] starting backend
+2022-04-04 18:11:03,363 INFO    MainThread:1242310 [backend.py:_multiprocessing_setup():99] multiprocessing start_methods=fork,spawn,forkserver, using: spawn
+2022-04-04 18:11:03,375 INFO    MainThread:1242310 [backend.py:ensure_launched():219] starting backend process...
+2022-04-04 18:11:03,383 INFO    MainThread:1242310 [backend.py:ensure_launched():224] started backend process with pid: 1242765
+2022-04-04 18:11:03,384 INFO    MainThread:1242310 [wandb_init.py:init():501] backend started and connected
+2022-04-04 18:11:03,391 INFO    MainThread:1242310 [wandb_run.py:_config_callback():992] config_cb None None {'dataset_cache_dir': '/home/sanchitgandhi/cache/huggingface/datasets', 'dataset_config_name': 'clean', 'dataset_name': 'librispeech_asr', 'eval_split_name': 'validation', 'generation_max_length': 40, 'generation_num_beams': 1, 'gradient_accumulation_steps': 1, 'learning_rate': 9.383495031304748e-05, 'length_column_name': 'input_length', 'logging_steps': 1, 'matmul_precision': 'highest', 'max_duration_in_seconds': 15, 'max_target_length': 64, 'min_duration_in_seconds': 15, 'model_name_or_path': './', 'num_train_epochs': 5, 'output_dir': './', 'per_device_eval_batch_size': 2, 'per_device_train_batch_size': 2, 'preprocessing_num_workers': 16, 'text_column_name': 'text', 'train_split_name': 'train.100', 'wandb_project': 'flax-wav2vec2-2-bart-large-cnn', 'warmup_steps': 500}
+2022-04-04 18:11:03,394 INFO    MainThread:1242310 [wandb_init.py:init():565] updated telemetry
+2022-04-04 18:11:03,414 INFO    MainThread:1242310 [wandb_init.py:init():596] communicating run to backend with 30 second timeout
+2022-04-04 18:11:04,226 INFO    MainThread:1242310 [wandb_run.py:_on_init():1759] communicating current version
+2022-04-04 18:11:04,285 INFO    MainThread:1242310 [wandb_run.py:_on_init():1763] got version response
+2022-04-04 18:11:04,285 INFO    MainThread:1242310 [wandb_init.py:init():625] starting run threads in backend
+2022-04-04 18:11:06,491 INFO    MainThread:1242310 [wandb_run.py:_console_start():1733] atexit reg
+2022-04-04 18:11:06,491 INFO    MainThread:1242310 [wandb_run.py:_redirect():1606] redirect: SettingsConsole.REDIRECT
+2022-04-04 18:11:06,492 INFO    MainThread:1242310 [wandb_run.py:_redirect():1611] Redirecting console.
+2022-04-04 18:11:06,494 INFO    MainThread:1242310 [wandb_run.py:_redirect():1667] Redirects installed.
+2022-04-04 18:11:06,494 INFO    MainThread:1242310 [wandb_init.py:init():664] run started, returning control to user process
+2022-04-04 18:11:25,876 INFO    MainThread:1242310 [wandb_run.py:_atexit_cleanup():1702] got exitcode: 1
+2022-04-04 18:11:25,880 INFO    MainThread:1242310 [wandb_run.py:_restore():1674] restore
+2022-04-04 18:11:28,241 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 1
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 1948
+}
+2022-04-04 18:11:28,410 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 1
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 1948
+}
+2022-04-04 18:11:29,247 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 4
+}
+pusher_stats {
+  uploaded_bytes: 1948
+  total_bytes: 45265
+}
+2022-04-04 18:11:29,349 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:11:29,450 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:11:29,552 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:11:29,653 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:11:29,831 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+2022-04-04 18:11:30,698 INFO    MainThread:1242310 [wandb_run.py:_on_finish():1831] got exit ret: done: true
+exit_result {
+}
+file_counts {
+  wandb_count: 5
+}
+pusher_stats {
+  uploaded_bytes: 45292
+  total_bytes: 45292
+}
+local_info {
+}
+2022-04-04 18:11:32,137 INFO    MainThread:1242310 [wandb_run.py:_footer_history_summary_info():2865] rendering history
+2022-04-04 18:11:32,137 INFO    MainThread:1242310 [wandb_run.py:_footer_history_summary_info():2894] rendering summary
+2022-04-04 18:11:32,139 INFO    MainThread:1242310 [wandb_run.py:_footer_sync_info():2822] logging synced files

wandb/run-20220404_181103-88xgr1fg/run-88xgr1fg.wandb ADDED Viewed

Binary file (40.3 kB). View file

wandb/run-20220404_181139-xmgtui21/files/config.yaml ADDED Viewed

	@@ -0,0 +1,108 @@

+wandb_version: 1
+_wandb:
+  desc: null
+  value:
+    cli_version: 0.12.11
+    framework: huggingface
+    huggingface_version: 4.18.0.dev0
+    is_jupyter_run: false
+    is_kaggle_kernel: false
+    python_version: 3.8.10
+    start_time: 1649095899
+    t:
+      1:
+      - 1
+      - 2
+      - 3
+      - 11
+      - 12
+      - 45
+      - 49
+      - 51
+      2:
+      - 1
+      - 2
+      - 3
+      - 11
+      - 12
+      - 45
+      - 49
+      - 51
+      4: 3.8.10
+      5: 0.12.11
+      6: 4.18.0.dev0
+      8:
+      - 5
+dataset_cache_dir:
+  desc: null
+  value: /home/sanchitgandhi/cache/huggingface/datasets
+dataset_config_name:
+  desc: null
+  value: clean
+dataset_name:
+  desc: null
+  value: librispeech_asr
+eval_split_name:
+  desc: null
+  value: validation
+generation_max_length:
+  desc: null
+  value: 40
+generation_num_beams:
+  desc: null
+  value: 1
+gradient_accumulation_steps:
+  desc: null
+  value: 1
+learning_rate:
+  desc: null
+  value: 7.331199736432637e-05
+length_column_name:
+  desc: null
+  value: input_length
+logging_steps:
+  desc: null
+  value: 1
+matmul_precision:
+  desc: null
+  value: highest
+max_duration_in_seconds:
+  desc: null
+  value: 15
+max_target_length:
+  desc: null
+  value: 64
+min_duration_in_seconds:
+  desc: null
+  value: 15
+model_name_or_path:
+  desc: null
+  value: ./
+num_train_epochs:
+  desc: null
+  value: 5
+output_dir:
+  desc: null
+  value: ./
+per_device_eval_batch_size:
+  desc: null
+  value: 2
+per_device_train_batch_size:
+  desc: null
+  value: 2
+preprocessing_num_workers:
+  desc: null
+  value: 16
+text_column_name:
+  desc: null
+  value: text
+train_split_name:
+  desc: null
+  value: train.100
+wandb_project:
+  desc: null
+  value: flax-wav2vec2-2-bart-large-cnn
+warmup_steps:
+  desc: null
+  value: 500

wandb/run-20220404_181139-xmgtui21/files/output.log ADDED Viewed

	@@ -0,0 +1,793 @@

+04/04/2022 18:11:42 - INFO - __main__ - Training/evaluation parameters FlaxSeq2SeqTrainingArguments(
+_n_gpu=0,
+adafactor=False,
+adam_beta1=0.9,
+adam_beta2=0.999,
+adam_epsilon=1e-08,
+bf16=False,
+bf16_full_eval=False,
+data_seed=None,
+dataloader_drop_last=False,
+dataloader_num_workers=0,
+dataloader_pin_memory=True,
+ddp_bucket_cap_mb=None,
+ddp_find_unused_parameters=None,
+debug=[],
+deepspeed=None,
+disable_tqdm=False,
+do_eval=True,
+do_predict=False,
+do_train=True,
+eval_accumulation_steps=None,
+eval_delay=0,
+eval_steps=None,
+evaluation_strategy=IntervalStrategy.NO,
+fp16=False,
+fp16_backend=auto,
+fp16_full_eval=False,
+fp16_opt_level=O1,
+generation_max_length=40,
+generation_num_beams=1,
+gradient_accumulation_steps=1,
+gradient_checkpointing=False,
+greater_is_better=None,
+group_by_length=False,
+half_precision_backend=auto,
+hub_model_id=None,
+hub_strategy=HubStrategy.EVERY_SAVE,
+hub_token=<HUB_TOKEN>,
+ignore_data_skip=False,
+label_names=None,
+label_smoothing_factor=0.0,
+learning_rate=7.331199736432637e-05,
+length_column_name=input_length,
+load_best_model_at_end=False,
+local_rank=-1,
+log_level=-1,
+log_level_replica=-1,
+log_on_each_node=True,
+logging_dir=./runs/Apr04_18-11-39_t1v-n-4eb331dd-w-0,
+logging_first_step=False,
+logging_nan_inf_filter=True,
+logging_steps=1,
+logging_strategy=IntervalStrategy.STEPS,
+lr_scheduler_type=SchedulerType.LINEAR,
+matmul_precision=highest,
+max_grad_norm=1.0,
+max_steps=-1,
+metric_for_best_model=None,
+mixed_precision=False,
+mp_parameters=,
+no_cuda=False,
+num_train_epochs=5.0,
+optim=OptimizerNames.ADAMW_HF,
+output_dir=./,
+overwrite_output_dir=True,
+past_index=-1,
+per_device_eval_batch_size=2,
+per_device_train_batch_size=2,
+predict_with_generate=True,
+prediction_loss_only=False,
+push_to_hub=False,
+push_to_hub_model_id=None,
+push_to_hub_organization=None,
+push_to_hub_token=<PUSH_TO_HUB_TOKEN>,
+remove_unused_columns=True,
+report_to=['tensorboard', 'wandb'],
+resume_from_checkpoint=None,
+run_name=./,
+save_on_each_node=False,
+save_steps=500,
+save_strategy=IntervalStrategy.STEPS,
+save_total_limit=None,
+seed=42,
+sharded_ddp=[],
+skip_memory_metrics=True,
+sortish_sampler=False,
+tf32=None,
+tpu_metrics_debug=False,
+tpu_num_cores=None,
+use_legacy_prediction_loop=False,
+warmup_ratio=0.0,
+warmup_steps=500,
+weight_decay=0.0,
+xpu_backend=None,
+)
+04/04/2022 18:11:42 - INFO - __main__ - JAX devices: 1, matmul precision: highest
+04/04/2022 18:11:42 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c)
+04/04/2022 18:11:42 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c)
+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",
+    "_num_labels": 3,
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+loading weights file ./flax_model.msgpack
+tcmalloc: large alloc 2353643520 bytes == 0x9c1e8000 @  0x7fb0f2c21680 0x7fb0f2c42824 0x5f8a01 0x648cf1 0x5c4676 0x4f290e 0x64f718 0x5048b3 0x56b1da 0x56939a 0x5f6a13 0x50af49 0x5f3547 0x56c8cd 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x68d047 0x67e351 0x67e3cf 0x67e471 0x67e817 0x6b6fe2 0x6b736d 0x7fb0f2a330b3 0x5fa5ce
+All model checkpoint weights were used when initializing FlaxSpeechEncoderDecoderModel.
+All the weights of FlaxSpeechEncoderDecoderModel were initialized from the model checkpoint at ./.
+If your task is similar to the task the model of the checkpoint was trained on, you can already use FlaxSpeechEncoderDecoderModel for predictions without further training.
+Feature extractor saved in ./preprocessor_config.json
+tokenizer config file saved in ./tokenizer_config.json
+Special tokens file saved in ./special_tokens_map.json
+Configuration saved in ./config.json
+loading feature extractor configuration file ./preprocessor_config.json
+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "facebook/bart-large-cnn",
+    "_num_labels": 3,
+    "activation_dropout": 0.0,
+    "activation_function": "gelu",
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartForConditionalGeneration"
+    ],
+    "attention_dropout": 0.0,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.0,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "force_bos_token_to_be_generated": true,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "gradient_checkpointing": false,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 2.0,
+    "max_length": 142,
+    "max_position_embeddings": 1024,
+    "min_length": 56,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_past": true,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": " ",
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "early_stopping": true,
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "no_repeat_ngram_size": 3,
+        "num_beams": 4
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "vocab_size": 50264
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "facebook/wav2vec2-large-lv60",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "gradient_checkpointing": false,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+2022-04-04 18:12:01.391712: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcuda.so.1'; dlerror: libcuda.so.1: cannot open shared object file: No such file or directory
+2022-04-04 18:12:01.391753: W tensorflow/stream_executor/cuda/cuda_driver.cc:269] failed call to cuInit: UNKNOWN ERROR (303)
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-eb8e77ddeb6c34dc.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e19eb46cb05f7b14.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-92685008e5c09846.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-0d478bd8b093039a.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-13aa6d940e98be09.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-2d24e62de045a0c8.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-c6e972d87654db26.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-4771f1765b989007.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ab9a2fefe02761db.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-6ce32d0e344f4c06.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-1e0f4ae48a3c8b80.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e6f5ab8655734a9f.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-be6a3a97adc5697a.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-239fcccc5b67f7a4.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ff31cd13241c8bf3.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-e8bf216b19718031.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-03ee7ff6632282a6.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-bb1b7de42a389f66.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-ed92b3340af62815.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-12ce4b2b8350532d.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-75f20b5cb7b89a9d.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-69941cf3a70dde04.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-f4d0102728859e5f.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-1c0eaf46e759e04d.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-9f8c4dccc4fa8f17.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-14df38b848e61b52.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-19c662ecc5b20d66.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-3276de10dacb4963.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-111057e4500c4cc5.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-d1bf30028d638290.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cc50c08263e878fc.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-f1813a8ae49a67d6.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00000_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00001_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00002_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00003_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00004_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00005_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00006_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00007_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00008_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00009_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00010_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00011_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00012_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00013_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00014_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-a668e959fdd4c3af_00015_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00000_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00001_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00002_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00003_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00004_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00005_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00006_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00007_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00008_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00009_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00010_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00011_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00012_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00013_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00014_of_00016.arrow
+04/04/2022 18:12:00 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/clean/2.1.0/1f4602f6b5fed8d3ab3e3382783173f2e12d9877e98775e34d7780881175096c/cache-cea415e4aeb9dd74_00015_of_00016.arrow
+04/04/2022 18:12:04 - INFO - __main__ - ***** Running training *****
+04/04/2022 18:12:04 - INFO - __main__ -   Num examples = 0
+04/04/2022 18:12:04 - INFO - __main__ -   Num Epochs = 5
+04/04/2022 18:12:04 - INFO - __main__ -   Instantaneous batch size per device = 2
+04/04/2022 18:12:04 - INFO - __main__ -   Num gradient accumulation steps = 1
+04/04/2022 18:12:04 - INFO - __main__ -   Total train batch size (w. parallel & distributed) = 2
+04/04/2022 18:12:04 - INFO - __main__ -   Total optimization steps = 0
+Epoch ... (1/5):   0%|                                                                            | 0/5 [00:00<?, ?it/s]
+Traceback (most recent call last):
+  File "run_flax_speech_recognition_seq2seq.py", line 1133, in <module>
+    main()
+  File "run_flax_speech_recognition_seq2seq.py", line 1050, in main
+    train_samples_idx = get_grouped_indices(vectorized_datasets["train"], batch_size_per_update, input_rng)
+  File "run_flax_speech_recognition_seq2seq.py", line 453, in get_grouped_indices
+    lengths = dataset["input_length"]
+  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1765, in __getitem__
+    return self._getitem(
+  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1749, in _getitem
+    pa_subtable = query_table(self._data, key, indices=self._indices if self._indices is not None else None)
+  File "/home/sanchitgandhi/datasets/src/datasets/formatting/formatting.py", line 491, in query_table
+    pa_subtable = _query_table_with_indices_mapping(table, key, indices=indices)
+  File "/home/sanchitgandhi/datasets/src/datasets/formatting/formatting.py", line 69, in _query_table_with_indices_mapping
+    return _query_table(table, indices.column(0).to_pylist())
+  File "/home/sanchitgandhi/datasets/src/datasets/table.py", line 343, in column
+    return self.table.column(*args, **kwargs)
+  File "pyarrow/table.pxi", line 2115, in pyarrow.lib.Table.column
+  File "pyarrow/table.pxi", line 2130, in pyarrow.lib.Table._column
+  File "pyarrow/array.pxi", line 561, in pyarrow.lib._normalize_index
+IndexError: index out of bounds

wandb/run-20220404_181139-xmgtui21/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,177 @@

+absl-py==1.0.0
+aiohttp==3.8.1
+aiosignal==1.2.0
+anyio==3.5.0
+appdirs==1.4.4
+argon2-cffi-bindings==21.2.0
+argon2-cffi==21.3.0
+asttokens==2.0.5
+astunparse==1.6.3
+async-timeout==4.0.2
+attrs==21.4.0
+audioread==2.1.9
+babel==2.9.1
+backcall==0.2.0
+beautifulsoup4==4.10.0
+bleach==4.1.0
+cachetools==5.0.0
+certifi==2021.10.8
+cffi==1.15.0
+charset-normalizer==2.0.12
+chex==0.1.1
+click==8.1.0
+cycler==0.11.0
+datasets==2.0.1.dev0
+debugpy==1.6.0
+decorator==5.1.1
+defusedxml==0.7.1
+dill==0.3.4
+dm-tree==0.1.6
+docker-pycreds==0.4.0
+entrypoints==0.4
+executing==0.8.3
+filelock==3.6.0
+flatbuffers==2.0
+flax==0.4.1
+fonttools==4.31.2
+frozenlist==1.3.0
+fsspec==2022.2.0
+gast==0.5.3
+gitdb==4.0.9
+gitpython==3.1.27
+google-auth-oauthlib==0.4.6
+google-auth==2.6.2
+google-pasta==0.2.0
+grpcio==1.44.0
+h5py==3.6.0
+huggingface-hub==0.4.0
+idna==3.3
+importlib-metadata==4.11.3
+importlib-resources==5.6.0
+ipdb==0.13.9
+ipykernel==6.10.0
+ipython-genutils==0.2.0
+ipython==8.2.0
+jax==0.3.4
+jaxlib==0.3.2
+jedi==0.18.1
+jinja2==3.1.1
+jiwer==2.3.0
+joblib==1.1.0
+json5==0.9.6
+jsonschema==4.4.0
+jupyter-client==7.2.1
+jupyter-core==4.9.2
+jupyter-server==1.16.0
+jupyterlab-pygments==0.1.2
+jupyterlab-server==2.12.0
+jupyterlab==3.3.2
+keras-preprocessing==1.1.2
+keras==2.8.0
+kiwisolver==1.4.2
+libclang==13.0.0
+librosa==0.9.1
+libtpu-nightly==0.1.dev20220315
+llvmlite==0.38.0
+markdown==3.3.6
+markupsafe==2.1.1
+matplotlib-inline==0.1.3
+matplotlib==3.5.1
+mistune==0.8.4
+msgpack==1.0.3
+multidict==6.0.2
+multiprocess==0.70.12.2
+nbclassic==0.3.7
+nbclient==0.5.13
+nbconvert==6.4.5
+nbformat==5.2.0
+nest-asyncio==1.5.4
+notebook-shim==0.1.0
+notebook==6.4.10
+numba==0.55.1
+numpy==1.21.0
+oauthlib==3.2.0
+opt-einsum==3.3.0
+optax==0.1.1
+packaging==21.3
+pandas==1.4.1
+pandocfilters==1.5.0
+parso==0.8.3
+pathtools==0.1.2
+pexpect==4.8.0
+pickleshare==0.7.5
+pillow==9.0.1
+pip==20.0.2
+pkg-resources==0.0.0
+pooch==1.6.0
+prometheus-client==0.13.1
+promise==2.3
+prompt-toolkit==3.0.28
+protobuf==3.19.4
+psutil==5.9.0
+ptyprocess==0.7.0
+pure-eval==0.2.2
+pyarrow==7.0.0
+pyasn1-modules==0.2.8
+pyasn1==0.4.8
+pycparser==2.21
+pygments==2.11.2
+pyparsing==3.0.7
+pyrsistent==0.18.1
+python-dateutil==2.8.2
+python-levenshtein==0.12.2
+pytz==2022.1
+pyyaml==6.0
+pyzmq==22.3.0
+regex==2022.3.15
+requests-oauthlib==1.3.1
+requests==2.27.1
+resampy==0.2.2
+responses==0.18.0
+rsa==4.8
+sacremoses==0.0.49
+scikit-learn==1.0.2
+scipy==1.8.0
+send2trash==1.8.0
+sentry-sdk==1.5.8
+setproctitle==1.2.2
+setuptools==44.0.0
+shortuuid==1.0.8
+six==1.16.0
+smmap==5.0.0
+sniffio==1.2.0
+soundfile==0.10.3.post1
+soupsieve==2.3.1
+stack-data==0.2.0
+tensorboard-data-server==0.6.1
+tensorboard-plugin-wit==1.8.1
+tensorboard==2.8.0
+tensorflow-io-gcs-filesystem==0.24.0
+tensorflow==2.8.0
+termcolor==1.1.0
+terminado==0.13.3
+testpath==0.6.0
+tf-estimator-nightly==2.8.0.dev2021122109
+threadpoolctl==3.1.0
+tokenizers==0.11.6
+toml==0.10.2
+toolz==0.11.2
+torch==1.11.0+cpu
+torchaudio==0.11.0+cpu
+tornado==6.1
+tqdm==4.63.1
+traitlets==5.1.1
+transformers==4.18.0.dev0
+typing-extensions==4.1.1
+urllib3==1.26.9
+wandb==0.12.11
+wcwidth==0.2.5
+webencodings==0.5.1
+websocket-client==1.3.2
+werkzeug==2.1.0
+wheel==0.37.1
+wrapt==1.14.0
+xxhash==3.0.0
+yarl==1.7.2
+yaspin==2.1.0
+zipp==3.7.0

wandb/run-20220404_181139-xmgtui21/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+    "os": "Linux-5.4.0-1043-gcp-x86_64-with-glibc2.29",
+    "python": "3.8.10",
+    "heartbeatAt": "2022-04-04T18:11:42.230539",
+    "startedAt": "2022-04-04T18:11:39.127973",
+    "docker": null,
+    "cpu_count": 96,
+    "cuda": null,
+    "args": [
+        "--overwrite_output_dir",
+        "--freeze_feature_encoder",
+        "--predict_with_generate",
+        "--do_lower_case",
+        "--do_train",
+        "--do_eval",
+        "--dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets",
+        "--dataset_config_name=clean",
+        "--dataset_name=librispeech_asr",
+        "--eval_split_name=validation",
+        "--generation_max_length=40",
+        "--generation_num_beams=1",
+        "--gradient_accumulation_steps=1",
+        "--learning_rate=7.331199736432637e-05",
+        "--length_column_name=input_length",
+        "--logging_steps=1",
+        "--matmul_precision=highest",
+        "--max_duration_in_seconds=15",
+        "--max_target_length=64",
+        "--min_duration_in_seconds=15",
+        "--model_name_or_path=./",
+        "--num_train_epochs=5",
+        "--output_dir=./",
+        "--per_device_eval_batch_size=2",
+        "--per_device_train_batch_size=2",
+        "--preprocessing_num_workers=16",
+        "--text_column_name=text",
+        "--train_split_name=train.100",
+        "--wandb_project=flax-wav2vec2-2-bart-large-cnn",
+        "--warmup_steps=500"
+    ],
+    "state": "running",
+    "program": "run_flax_speech_recognition_seq2seq.py",
+    "codePath": "run_flax_speech_recognition_seq2seq.py",
+    "git": {
+        "remote": "https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-cnn",
+        "commit": "c09faa6b18ac3f19251c414100acf1bad11c1b16"
+    },
+    "email": "sanchit@huggingface.co",
+    "root": "/home/sanchitgandhi/flax-wav2vec2-2-bart-large-cnn",
+    "host": "t1v-n-4eb331dd-w-0",
+    "username": "sanchitgandhi",
+    "executable": "/home/sanchitgandhi/venv/bin/python3"
+}