End of training

Browse files

Files changed (12) hide show

pytorch_model.bin +1 -1
runs/{May17_01-31-58_0d0f38c34c7b → xlsrDe-d}/1652751127.5893614/events.out.tfevents.1652751127.0d0f38c34c7b.1404.1 +0 -0
runs/{May17_01-31-58_0d0f38c34c7b → xlsrDe-d}/events.out.tfevents.1652751127.0d0f38c34c7b.1404.0 +2 -2
xlsrDe-d/config.json +86 -0
xlsrDe-d/optimizer.pt +3 -0
xlsrDe-d/preprocessor_config.json +9 -0
xlsrDe-d/pytorch_model.bin +3 -0
xlsrDe-d/rng_state.pth +3 -0
xlsrDe-d/scaler.pt +3 -0
xlsrDe-d/scheduler.pt +3 -0
xlsrDe-d/trainer_state.json +256 -0
xlsrDe-d/training_args.bin +3 -0

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d79e5fd2754fa90ea4955d2e1eb959dac8e0055d81761ad729d3ffbfd110abc
 size 1262079473

 version https://git-lfs.github.com/spec/v1
+oid sha256:8abdd1bbd27fa6778d8c7b7df3d12088c8c513356992eb0f7424a65a023ce0b3
 size 1262079473

runs/{May17_01-31-58_0d0f38c34c7b → xlsrDe-d}/1652751127.5893614/events.out.tfevents.1652751127.0d0f38c34c7b.1404.1 RENAMED Viewed

File without changes

runs/{May17_01-31-58_0d0f38c34c7b → xlsrDe-d}/events.out.tfevents.1652751127.0d0f38c34c7b.1404.0 RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:904ae5272ffe16c7c21ca65d7e3190c38e14af4441a6fba4354f63069808b004
-size 11921

 version https://git-lfs.github.com/spec/v1
+oid sha256:e3ff1acc1702f8b2671555185da39db837589d401e1628e7a8984a6f415d03f9
+size 12275

xlsrDe-d/config.json ADDED Viewed

	@@ -0,0 +1,86 @@

+{
+  "_name_or_path": "jonatasgrosman/wav2vec2-large-xlsr-53-german",
+  "activation_dropout": 0.05,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.5,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "pad_token_id": 24,
+  "proj_codevector_dim": 768,
+  "torch_dtype": "float32",
+  "transformers_version": "4.11.3",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 38
+}

xlsrDe-d/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:faa60cada6e65ce1c3d5a6a916782d003fc163fb3a48895c8783d6cc3f66a6d5
+size 2490370577

xlsrDe-d/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

xlsrDe-d/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3d79e5fd2754fa90ea4955d2e1eb959dac8e0055d81761ad729d3ffbfd110abc
+size 1262079473

xlsrDe-d/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:43b183631dae7312fa06471905adfa9a1e0795c11a6c4540a4697d12e37e632d
+size 14567

xlsrDe-d/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:378256d35f3510dc9e76f4371bc34b02a30c7a0699ed25a2ad3696ff0f439dc5
+size 559

xlsrDe-d/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8fd6b64173700554787bd96b3a97002f204277035a984524a8a564f4da1aa28
+size 623

xlsrDe-d/trainer_state.json ADDED Viewed

	@@ -0,0 +1,256 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 799.8,
+  "global_step": 1600,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 49.8,
+      "learning_rate": 5.6999999999999996e-05,
+      "loss": 63.303,
+      "step": 100
+    },
+    {
+      "epoch": 49.8,
+      "eval_loss": 3.881598949432373,
+      "eval_runtime": 1.6151,
+      "eval_samples_per_second": 33.434,
+      "eval_steps_per_second": 4.334,
+      "eval_wer": 1.0,
+      "step": 100
+    },
+    {
+      "epoch": 99.8,
+      "learning_rate": 0.000117,
+      "loss": 1.0894,
+      "step": 200
+    },
+    {
+      "epoch": 99.8,
+      "eval_loss": 6.306798458099365,
+      "eval_runtime": 1.6201,
+      "eval_samples_per_second": 33.33,
+      "eval_steps_per_second": 4.321,
+      "eval_wer": 1.0289855072463767,
+      "step": 200
+    },
+    {
+      "epoch": 149.8,
+      "learning_rate": 0.00017699999999999997,
+      "loss": 0.2105,
+      "step": 300
+    },
+    {
+      "epoch": 149.8,
+      "eval_loss": 7.806252479553223,
+      "eval_runtime": 1.6345,
+      "eval_samples_per_second": 33.037,
+      "eval_steps_per_second": 4.283,
+      "eval_wer": 1.0,
+      "step": 300
+    },
+    {
+      "epoch": 199.8,
+      "learning_rate": 0.000237,
+      "loss": 0.1022,
+      "step": 400
+    },
+    {
+      "epoch": 199.8,
+      "eval_loss": 8.66800594329834,
+      "eval_runtime": 1.6359,
+      "eval_samples_per_second": 33.01,
+      "eval_steps_per_second": 4.279,
+      "eval_wer": 1.0289855072463767,
+      "step": 400
+    },
+    {
+      "epoch": 249.8,
+      "learning_rate": 0.00029699999999999996,
+      "loss": 0.0992,
+      "step": 500
+    },
+    {
+      "epoch": 249.8,
+      "eval_loss": 10.373652458190918,
+      "eval_runtime": 1.6295,
+      "eval_samples_per_second": 33.139,
+      "eval_steps_per_second": 4.296,
+      "eval_wer": 1.0144927536231885,
+      "step": 500
+    },
+    {
+      "epoch": 299.8,
+      "learning_rate": 0.0002740909090909091,
+      "loss": 0.0732,
+      "step": 600
+    },
+    {
+      "epoch": 299.8,
+      "eval_loss": 8.226058006286621,
+      "eval_runtime": 1.6292,
+      "eval_samples_per_second": 33.146,
+      "eval_steps_per_second": 4.297,
+      "eval_wer": 1.0,
+      "step": 600
+    },
+    {
+      "epoch": 349.8,
+      "learning_rate": 0.0002468181818181818,
+      "loss": 0.0419,
+      "step": 700
+    },
+    {
+      "epoch": 349.8,
+      "eval_loss": 9.197142601013184,
+      "eval_runtime": 1.6246,
+      "eval_samples_per_second": 33.239,
+      "eval_steps_per_second": 4.309,
+      "eval_wer": 1.0289855072463767,
+      "step": 700
+    },
+    {
+      "epoch": 399.8,
+      "learning_rate": 0.00021954545454545452,
+      "loss": 0.0273,
+      "step": 800
+    },
+    {
+      "epoch": 399.8,
+      "eval_loss": 9.849931716918945,
+      "eval_runtime": 1.6419,
+      "eval_samples_per_second": 32.888,
+      "eval_steps_per_second": 4.263,
+      "eval_wer": 1.0434782608695652,
+      "step": 800
+    },
+    {
+      "epoch": 449.8,
+      "learning_rate": 0.00019227272727272723,
+      "loss": 0.0226,
+      "step": 900
+    },
+    {
+      "epoch": 449.8,
+      "eval_loss": 10.22618293762207,
+      "eval_runtime": 1.6076,
+      "eval_samples_per_second": 33.591,
+      "eval_steps_per_second": 4.354,
+      "eval_wer": 1.0144927536231885,
+      "step": 900
+    },
+    {
+      "epoch": 499.8,
+      "learning_rate": 0.000165,
+      "loss": 0.0182,
+      "step": 1000
+    },
+    {
+      "epoch": 499.8,
+      "eval_loss": 10.209068298339844,
+      "eval_runtime": 1.609,
+      "eval_samples_per_second": 33.562,
+      "eval_steps_per_second": 4.351,
+      "eval_wer": 1.0289855072463767,
+      "step": 1000
+    },
+    {
+      "epoch": 549.8,
+      "learning_rate": 0.0001377272727272727,
+      "loss": 0.0099,
+      "step": 1100
+    },
+    {
+      "epoch": 549.8,
+      "eval_loss": 10.943706512451172,
+      "eval_runtime": 1.6307,
+      "eval_samples_per_second": 33.115,
+      "eval_steps_per_second": 4.293,
+      "eval_wer": 1.0,
+      "step": 1100
+    },
+    {
+      "epoch": 599.8,
+      "learning_rate": 0.00011045454545454545,
+      "loss": 0.0046,
+      "step": 1200
+    },
+    {
+      "epoch": 599.8,
+      "eval_loss": 10.346452713012695,
+      "eval_runtime": 1.613,
+      "eval_samples_per_second": 33.478,
+      "eval_steps_per_second": 4.34,
+      "eval_wer": 1.0,
+      "step": 1200
+    },
+    {
+      "epoch": 649.8,
+      "learning_rate": 8.318181818181818e-05,
+      "loss": 0.0108,
+      "step": 1300
+    },
+    {
+      "epoch": 649.8,
+      "eval_loss": 9.559195518493652,
+      "eval_runtime": 1.6215,
+      "eval_samples_per_second": 33.302,
+      "eval_steps_per_second": 4.317,
+      "eval_wer": 1.0,
+      "step": 1300
+    },
+    {
+      "epoch": 699.8,
+      "learning_rate": 5.590909090909091e-05,
+      "loss": 0.006,
+      "step": 1400
+    },
+    {
+      "epoch": 699.8,
+      "eval_loss": 10.173698425292969,
+      "eval_runtime": 1.6283,
+      "eval_samples_per_second": 33.164,
+      "eval_steps_per_second": 4.299,
+      "eval_wer": 1.0144927536231885,
+      "step": 1400
+    },
+    {
+      "epoch": 749.8,
+      "learning_rate": 2.8636363636363634e-05,
+      "loss": 0.003,
+      "step": 1500
+    },
+    {
+      "epoch": 749.8,
+      "eval_loss": 9.914641380310059,
+      "eval_runtime": 1.6245,
+      "eval_samples_per_second": 33.241,
+      "eval_steps_per_second": 4.309,
+      "eval_wer": 1.0144927536231885,
+      "step": 1500
+    },
+    {
+      "epoch": 799.8,
+      "learning_rate": 1.3636363636363634e-06,
+      "loss": 0.0023,
+      "step": 1600
+    },
+    {
+      "epoch": 799.8,
+      "eval_loss": 10.248388290405273,
+      "eval_runtime": 1.6125,
+      "eval_samples_per_second": 33.488,
+      "eval_steps_per_second": 4.341,
+      "eval_wer": 1.0144927536231885,
+      "step": 1600
+    }
+  ],
+  "max_steps": 1600,
+  "num_train_epochs": 800,
+  "total_flos": 6.256122688468838e+18,
+  "trial_name": null,
+  "trial_params": null
+}

xlsrDe-d/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9eb099522910f5f0deff4d2bd83132cc3a06dd1e0148901d06b58b6760016e1
+size 2799