Commit

Browse files

Files changed (10) hide show

config.json +76 -0
optimizer.pt +3 -0
preprocessor_config.json +8 -0
pytorch_model.bin +3 -0
scheduler.pt +3 -0
special_tokens_map.json +1 -0
tokenizer_config.json +1 -0
trainer_state.json +364 -0
training_args.bin +3 -0
vocab.json +1 -0

config.json ADDED Viewed

	@@ -0,0 +1,76 @@

+{
+  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.055,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.094,
+  "bos_token_id": 1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.04,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": true,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.047,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.4,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_attention_heads": 16,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "pad_token_id": 36,
+  "transformers_version": "4.5.0.dev0",
+  "vocab_size": 37
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f81a6d827f36ff160b01894d8fba9e568d1b1a5f4b3683f9c10c374ec0caa0c1
+size 2490380551

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+  "do_normalize": true,
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77efb9ebce7119724b2f50470d43818968e2995389e8c40da30ca1a2aa35938d
+size 1262085527

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a31ffece1d5b746b3cd21adea0f69f1f47e7e31286d49b1ee37e9881e62d6cac
+size 623

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "[UNK]", "pad_token": "[PAD]"}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "bos_token": "<s>", "eos_token": "</s>", "pad_token": "[PAD]", "do_lower_case": false, "word_delimiter_token": "\|"}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,364 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 58.8235294117647,
+  "global_step": 9000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.96,
+      "eval_loss": 2.9419331550598145,
+      "eval_runtime": 165.8041,
+      "eval_samples_per_second": 11.122,
+      "eval_wer": 1.0,
+      "step": 300
+    },
+    {
+      "epoch": 3.27,
+      "learning_rate": 9.774774774774775e-05,
+      "loss": 5.732,
+      "step": 500
+    },
+    {
+      "epoch": 3.92,
+      "eval_loss": 2.8035287857055664,
+      "eval_runtime": 163.2568,
+      "eval_samples_per_second": 11.295,
+      "eval_wer": 1.0,
+      "step": 600
+    },
+    {
+      "epoch": 5.88,
+      "eval_loss": 0.5059587955474854,
+      "eval_runtime": 166.512,
+      "eval_samples_per_second": 11.074,
+      "eval_wer": 0.646839455528622,
+      "step": 900
+    },
+    {
+      "epoch": 6.54,
+      "learning_rate": 9.211711711711712e-05,
+      "loss": 1.7477,
+      "step": 1000
+    },
+    {
+      "epoch": 7.84,
+      "eval_loss": 0.31517693400382996,
+      "eval_runtime": 168.535,
+      "eval_samples_per_second": 10.941,
+      "eval_wer": 0.49533842998321836,
+      "step": 1200
+    },
+    {
+      "epoch": 9.8,
+      "learning_rate": 8.64864864864865e-05,
+      "loss": 0.4124,
+      "step": 1500
+    },
+    {
+      "epoch": 9.8,
+      "eval_loss": 0.30525174736976624,
+      "eval_runtime": 170.5049,
+      "eval_samples_per_second": 10.815,
+      "eval_wer": 0.4454596308036547,
+      "step": 1500
+    },
+    {
+      "epoch": 11.76,
+      "eval_loss": 0.27497437596321106,
+      "eval_runtime": 171.8183,
+      "eval_samples_per_second": 10.732,
+      "eval_wer": 0.4267201193361924,
+      "step": 1800
+    },
+    {
+      "epoch": 13.07,
+      "learning_rate": 8.085585585585586e-05,
+      "loss": 0.2831,
+      "step": 2000
+    },
+    {
+      "epoch": 13.73,
+      "eval_loss": 0.28638383746147156,
+      "eval_runtime": 174.9018,
+      "eval_samples_per_second": 10.543,
+      "eval_wer": 0.4133880290881969,
+      "step": 2100
+    },
+    {
+      "epoch": 15.69,
+      "eval_loss": 0.27328914403915405,
+      "eval_runtime": 174.9487,
+      "eval_samples_per_second": 10.54,
+      "eval_wer": 0.40583628566101065,
+      "step": 2400
+    },
+    {
+      "epoch": 16.34,
+      "learning_rate": 7.522522522522523e-05,
+      "loss": 0.2231,
+      "step": 2500
+    },
+    {
+      "epoch": 17.65,
+      "eval_loss": 0.29071566462516785,
+      "eval_runtime": 177.3068,
+      "eval_samples_per_second": 10.4,
+      "eval_wer": 0.3988439306358382,
+      "step": 2700
+    },
+    {
+      "epoch": 19.61,
+      "learning_rate": 6.95945945945946e-05,
+      "loss": 0.1885,
+      "step": 3000
+    },
+    {
+      "epoch": 19.61,
+      "eval_loss": 0.2765745520591736,
+      "eval_runtime": 177.2476,
+      "eval_samples_per_second": 10.404,
+      "eval_wer": 0.39912362483684505,
+      "step": 3000
+    },
+    {
+      "epoch": 21.57,
+      "eval_loss": 0.28941160440444946,
+      "eval_runtime": 180.7189,
+      "eval_samples_per_second": 10.204,
+      "eval_wer": 0.38355398098079435,
+      "step": 3300
+    },
+    {
+      "epoch": 22.88,
+      "learning_rate": 6.396396396396397e-05,
+      "loss": 0.1657,
+      "step": 3500
+    },
+    {
+      "epoch": 23.53,
+      "eval_loss": 0.27626267075538635,
+      "eval_runtime": 182.3178,
+      "eval_samples_per_second": 10.114,
+      "eval_wer": 0.38094350177139663,
+      "step": 3600
+    },
+    {
+      "epoch": 25.49,
+      "eval_loss": 0.28250962495803833,
+      "eval_runtime": 183.703,
+      "eval_samples_per_second": 10.038,
+      "eval_wer": 0.3820622785754242,
+      "step": 3900
+    },
+    {
+      "epoch": 26.14,
+      "learning_rate": 5.833333333333334e-05,
+      "loss": 0.1449,
+      "step": 4000
+    },
+    {
+      "epoch": 27.45,
+      "eval_loss": 0.27114051580429077,
+      "eval_runtime": 183.7677,
+      "eval_samples_per_second": 10.034,
+      "eval_wer": 0.38140965877307476,
+      "step": 4200
+    },
+    {
+      "epoch": 29.41,
+      "learning_rate": 5.27027027027027e-05,
+      "loss": 0.1344,
+      "step": 4500
+    },
+    {
+      "epoch": 29.41,
+      "eval_loss": 0.3000315725803375,
+      "eval_runtime": 185.7074,
+      "eval_samples_per_second": 9.93,
+      "eval_wer": 0.374230840947231,
+      "step": 4500
+    },
+    {
+      "epoch": 31.37,
+      "eval_loss": 0.2914937734603882,
+      "eval_runtime": 169.8087,
+      "eval_samples_per_second": 10.859,
+      "eval_wer": 0.3726459071415253,
+      "step": 4800
+    },
+    {
+      "epoch": 32.68,
+      "learning_rate": 4.707207207207208e-05,
+      "loss": 0.1229,
+      "step": 5000
+    },
+    {
+      "epoch": 33.33,
+      "eval_loss": 0.2908037304878235,
+      "eval_runtime": 189.3466,
+      "eval_samples_per_second": 9.739,
+      "eval_wer": 0.3699421965317919,
+      "step": 5100
+    },
+    {
+      "epoch": 35.29,
+      "eval_loss": 0.3009437620639801,
+      "eval_runtime": 170.798,
+      "eval_samples_per_second": 10.796,
+      "eval_wer": 0.3701286593324632,
+      "step": 5400
+    },
+    {
+      "epoch": 35.95,
+      "learning_rate": 4.1441441441441444e-05,
+      "loss": 0.1133,
+      "step": 5500
+    },
+    {
+      "epoch": 37.25,
+      "eval_loss": 0.3189816176891327,
+      "eval_runtime": 171.2661,
+      "eval_samples_per_second": 10.767,
+      "eval_wer": 0.36947603953011376,
+      "step": 5700
+    },
+    {
+      "epoch": 39.22,
+      "learning_rate": 3.581081081081081e-05,
+      "loss": 0.11,
+      "step": 6000
+    },
+    {
+      "epoch": 39.22,
+      "eval_loss": 0.30211004614830017,
+      "eval_runtime": 190.742,
+      "eval_samples_per_second": 9.668,
+      "eval_wer": 0.36267014730561253,
+      "step": 6000
+    },
+    {
+      "epoch": 41.18,
+      "eval_loss": 0.30648261308670044,
+      "eval_runtime": 173.8977,
+      "eval_samples_per_second": 10.604,
+      "eval_wer": 0.36677232892038036,
+      "step": 6300
+    },
+    {
+      "epoch": 42.48,
+      "learning_rate": 3.0180180180180183e-05,
+      "loss": 0.1006,
+      "step": 6500
+    },
+    {
+      "epoch": 43.14,
+      "eval_loss": 0.30688807368278503,
+      "eval_runtime": 195.1525,
+      "eval_samples_per_second": 9.449,
+      "eval_wer": 0.36826403132575053,
+      "step": 6600
+    },
+    {
+      "epoch": 45.1,
+      "eval_loss": 0.31185880303382874,
+      "eval_runtime": 176.2725,
+      "eval_samples_per_second": 10.461,
+      "eval_wer": 0.36164460190192055,
+      "step": 6900
+    },
+    {
+      "epoch": 45.75,
+      "learning_rate": 2.454954954954955e-05,
+      "loss": 0.0998,
+      "step": 7000
+    },
+    {
+      "epoch": 47.06,
+      "eval_loss": 0.31436818838119507,
+      "eval_runtime": 195.8727,
+      "eval_samples_per_second": 9.414,
+      "eval_wer": 0.36108521349990674,
+      "step": 7200
+    },
+    {
+      "epoch": 49.02,
+      "learning_rate": 1.891891891891892e-05,
+      "loss": 0.0952,
+      "step": 7500
+    },
+    {
+      "epoch": 49.02,
+      "eval_loss": 0.31186020374298096,
+      "eval_runtime": 201.6879,
+      "eval_samples_per_second": 9.143,
+      "eval_wer": 0.3613649077009137,
+      "step": 7500
+    },
+    {
+      "epoch": 50.98,
+      "eval_loss": 0.3063485026359558,
+      "eval_runtime": 177.6307,
+      "eval_samples_per_second": 10.381,
+      "eval_wer": 0.35959351109453663,
+      "step": 7800
+    },
+    {
+      "epoch": 52.29,
+      "learning_rate": 1.3288288288288289e-05,
+      "loss": 0.0898,
+      "step": 8000
+    },
+    {
+      "epoch": 52.94,
+      "eval_loss": 0.32244834303855896,
+      "eval_runtime": 179.3678,
+      "eval_samples_per_second": 10.281,
+      "eval_wer": 0.360525825097893,
+      "step": 8100
+    },
+    {
+      "epoch": 54.9,
+      "eval_loss": 0.32377830147743225,
+      "eval_runtime": 179.7421,
+      "eval_samples_per_second": 10.259,
+      "eval_wer": 0.360525825097893,
+      "step": 8400
+    },
+    {
+      "epoch": 55.56,
+      "learning_rate": 7.657657657657658e-06,
+      "loss": 0.0891,
+      "step": 8500
+    },
+    {
+      "epoch": 56.86,
+      "eval_loss": 0.3199419677257538,
+      "eval_runtime": 178.805,
+      "eval_samples_per_second": 10.313,
+      "eval_wer": 0.3609919820995711,
+      "step": 8700
+    },
+    {
+      "epoch": 58.82,
+      "learning_rate": 2.0270270270270273e-06,
+      "loss": 0.0877,
+      "step": 9000
+    },
+    {
+      "epoch": 58.82,
+      "eval_loss": 0.3155083954334259,
+      "eval_runtime": 180.9925,
+      "eval_samples_per_second": 10.188,
+      "eval_wer": 0.35922058549319413,
+      "step": 9000
+    }
+  ],
+  "max_steps": 9180,
+  "num_train_epochs": 60,
+  "total_flos": 6.238876246016606e+19,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:85def95de9b09edef95f86214537378b9d6ac7188834833e0eb400d64bd26951
+size 2351

vocab.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"n": 0, "k": 1, "m": 2, "z": 3, "v": 4, "∩": 5, "f": 6, "p": 8, "h": 9, "，": 10, "i": 11, "î": 12, "！": 13, "a": 14, "r": 15, "?": 16, "t": 17, "ε": 18, "b": 19, "w": 20, "c": 21, "s": 22, "l": 23, ",": 24, "x": 25, "d": 26, "ⁿ": 27, "u": 28, "e": 29, "o": 30, "j": 31, "'": 32, "y": 33, "g": 34, "\|": 7, "[UNK]": 35, "[PAD]": 36}