Upload 9 files

Browse files

Files changed (9) hide show

README.md +70 -1
all_results.json +12 -0
config.json +246 -0
eval_results.json +8 -0
preprocessor_config.json +14 -0
pytorch_model.bin +3 -0
train_results.json +7 -0
trainer_state.json +529 -0
training_args.bin +3 -0

README.md CHANGED Viewed

@@ -1,3 +1,72 @@
 ---
-license: cc-by-nc-sa-4.0
 ---

 ---
+license: apache-2.0
+tags:
+- audio-classification
+- generated_from_trainer
+datasets:
+- common_language
+metrics:
+- accuracy
+model-index:
+- name: out
+  results: []
 ---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# out
+This model is a fine-tuned version of [openai/whisper-small](https://huggingface.co/openai/whisper-small) on the common_language dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.6339
+- Accuracy: 0.8898
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 1e-05
+- train_batch_size: 32
+- eval_batch_size: 32
+- seed: 0
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 10.0
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 1.4103        | 1.0   | 694  | 1.1299          | 0.7471   |
+| 0.5324        | 2.0   | 1388 | 0.6167          | 0.8495   |
+| 0.3164        | 3.0   | 2082 | 0.5136          | 0.8679   |
+| 0.1535        | 4.0   | 2776 | 0.5264          | 0.8758   |
+| 0.1018        | 5.0   | 3470 | 0.5890          | 0.8767   |
+| 0.0555        | 6.0   | 4164 | 0.6121          | 0.8772   |
+| 0.031         | 7.0   | 4858 | 0.6624          | 0.8777   |
+| 0.0264        | 8.0   | 5552 | 0.6172          | 0.8869   |
+| 0.0079        | 9.0   | 6246 | 0.6225          | 0.8884   |
+| 0.0058        | 10.0  | 6940 | 0.6339          | 0.8898   |
+### Framework versions
+- Transformers 4.30.2
+- Pytorch 1.8.0+cu111
+- Datasets 2.11.0
+- Tokenizers 0.13.3

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 10.0,
+    "eval_accuracy": 0.8897758152173914,
+    "eval_loss": 0.6338901519775391,
+    "eval_runtime": 233.4489,
+    "eval_samples_per_second": 25.222,
+    "eval_steps_per_second": 0.788,
+    "train_loss": 0.3924562724076362,
+    "train_runtime": 18647.2594,
+    "train_samples_per_second": 11.902,
+    "train_steps_per_second": 0.372
+}

config.json ADDED Viewed

	@@ -0,0 +1,246 @@

+{
+  "_name_or_path": "openai/whisper-small",
+  "activation_dropout": 0.0,
+  "activation_function": "gelu",
+  "apply_spec_augment": false,
+  "architectures": [
+    "WhisperForAudioClassification"
+  ],
+  "attention_dropout": 0.0,
+  "begin_suppress_tokens": [
+    220,
+    50257
+  ],
+  "bos_token_id": 50257,
+  "classifier_proj_size": 256,
+  "d_model": 768,
+  "decoder_attention_heads": 12,
+  "decoder_ffn_dim": 3072,
+  "decoder_layerdrop": 0.0,
+  "decoder_layers": 12,
+  "decoder_start_token_id": 50258,
+  "dropout": 0.0,
+  "encoder_attention_heads": 12,
+  "encoder_ffn_dim": 3072,
+  "encoder_layerdrop": 0.0,
+  "encoder_layers": 12,
+  "eos_token_id": 50257,
+  "finetuning_task": "audio-classification",
+  "forced_decoder_ids": [
+    [
+      1,
+      50259
+    ],
+    [
+      2,
+      50359
+    ],
+    [
+      3,
+      50363
+    ]
+  ],
+  "id2label": {
+    "0": "Arabic",
+    "1": "Basque",
+    "10": "Dutch",
+    "11": "English",
+    "12": "Esperanto",
+    "13": "Estonian",
+    "14": "French",
+    "15": "Frisian",
+    "16": "Georgian",
+    "17": "German",
+    "18": "Greek",
+    "19": "Hakha_Chin",
+    "2": "Breton",
+    "20": "Indonesian",
+    "21": "Interlingua",
+    "22": "Italian",
+    "23": "Japanese",
+    "24": "Kabyle",
+    "25": "Kinyarwanda",
+    "26": "Kyrgyz",
+    "27": "Latvian",
+    "28": "Maltese",
+    "29": "Mangolian",
+    "3": "Catalan",
+    "30": "Persian",
+    "31": "Polish",
+    "32": "Portuguese",
+    "33": "Romanian",
+    "34": "Romansh_Sursilvan",
+    "35": "Russian",
+    "36": "Sakha",
+    "37": "Slovenian",
+    "38": "Spanish",
+    "39": "Swedish",
+    "4": "Chinese_China",
+    "40": "Tamil",
+    "41": "Tatar",
+    "42": "Turkish",
+    "43": "Ukranian",
+    "44": "Welsh",
+    "5": "Chinese_Hongkong",
+    "6": "Chinese_Taiwan",
+    "7": "Chuvash",
+    "8": "Czech",
+    "9": "Dhivehi"
+  },
+  "init_std": 0.02,
+  "is_encoder_decoder": true,
+  "label2id": {
+    "Arabic": "0",
+    "Basque": "1",
+    "Breton": "2",
+    "Catalan": "3",
+    "Chinese_China": "4",
+    "Chinese_Hongkong": "5",
+    "Chinese_Taiwan": "6",
+    "Chuvash": "7",
+    "Czech": "8",
+    "Dhivehi": "9",
+    "Dutch": "10",
+    "English": "11",
+    "Esperanto": "12",
+    "Estonian": "13",
+    "French": "14",
+    "Frisian": "15",
+    "Georgian": "16",
+    "German": "17",
+    "Greek": "18",
+    "Hakha_Chin": "19",
+    "Indonesian": "20",
+    "Interlingua": "21",
+    "Italian": "22",
+    "Japanese": "23",
+    "Kabyle": "24",
+    "Kinyarwanda": "25",
+    "Kyrgyz": "26",
+    "Latvian": "27",
+    "Maltese": "28",
+    "Mangolian": "29",
+    "Persian": "30",
+    "Polish": "31",
+    "Portuguese": "32",
+    "Romanian": "33",
+    "Romansh_Sursilvan": "34",
+    "Russian": "35",
+    "Sakha": "36",
+    "Slovenian": "37",
+    "Spanish": "38",
+    "Swedish": "39",
+    "Tamil": "40",
+    "Tatar": "41",
+    "Turkish": "42",
+    "Ukranian": "43",
+    "Welsh": "44"
+  },
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "max_length": 448,
+  "max_source_positions": 1500,
+  "max_target_positions": 448,
+  "model_type": "whisper",
+  "num_hidden_layers": 12,
+  "num_mel_bins": 80,
+  "pad_token_id": 50257,
+  "scale_embedding": false,
+  "suppress_tokens": [
+    1,
+    2,
+    7,
+    8,
+    9,
+    10,
+    14,
+    25,
+    26,
+    27,
+    28,
+    29,
+    31,
+    58,
+    59,
+    60,
+    61,
+    62,
+    63,
+    90,
+    91,
+    92,
+    93,
+    359,
+    503,
+    522,
+    542,
+    873,
+    893,
+    902,
+    918,
+    922,
+    931,
+    1350,
+    1853,
+    1982,
+    2460,
+    2627,
+    3246,
+    3253,
+    3268,
+    3536,
+    3846,
+    3961,
+    4183,
+    4667,
+    6585,
+    6647,
+    7273,
+    9061,
+    9383,
+    10428,
+    10929,
+    11938,
+    12033,
+    12331,
+    12562,
+    13793,
+    14157,
+    14635,
+    15265,
+    15618,
+    16553,
+    16604,
+    18362,
+    18956,
+    20075,
+    21675,
+    22520,
+    26130,
+    26161,
+    26435,
+    28279,
+    29464,
+    31650,
+    32302,
+    32470,
+    36865,
+    42863,
+    47425,
+    49870,
+    50254,
+    50258,
+    50360,
+    50361,
+    50362
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.30.2",
+  "use_cache": true,
+  "use_weighted_layer_sum": false,
+  "vocab_size": 51865
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 10.0,
+    "eval_accuracy": 0.8897758152173914,
+    "eval_loss": 0.6338901519775391,
+    "eval_runtime": 233.4489,
+    "eval_samples_per_second": 25.222,
+    "eval_steps_per_second": 0.788
+}

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "chunk_length": 30,
+  "feature_extractor_type": "WhisperFeatureExtractor",
+  "feature_size": 80,
+  "hop_length": 160,
+  "n_fft": 400,
+  "n_samples": 480000,
+  "nb_max_frames": 3000,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "processor_class": "WhisperProcessor",
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aac1acd3e553000ddee100565d65162516314472e48628a49a5b34de8c8cd0cd
+size 353514605

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 10.0,
+    "train_loss": 0.3924562724076362,
+    "train_runtime": 18647.2594,
+    "train_samples_per_second": 11.902,
+    "train_steps_per_second": 0.372
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,529 @@

+{
+  "best_metric": 0.8897758152173914,
+  "best_model_checkpoint": "out/checkpoint-6940",
+  "epoch": 10.0,
+  "global_step": 6940,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.14,
+      "learning_rate": 1.4409221902017292e-06,
+      "loss": 3.8183,
+      "step": 100
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 2.8818443804034585e-06,
+      "loss": 3.7614,
+      "step": 200
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.322766570605187e-06,
+      "loss": 3.2003,
+      "step": 300
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 5.749279538904899e-06,
+      "loss": 2.3107,
+      "step": 400
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 7.190201729106629e-06,
+      "loss": 1.7861,
+      "step": 500
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 8.631123919308358e-06,
+      "loss": 1.4103,
+      "step": 600
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7471127717391305,
+      "eval_loss": 1.1298972368240356,
+      "eval_runtime": 237.0543,
+      "eval_samples_per_second": 24.838,
+      "eval_steps_per_second": 0.776,
+      "step": 694
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 9.993595901376882e-06,
+      "loss": 1.1941,
+      "step": 700
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 9.833493435798911e-06,
+      "loss": 0.9417,
+      "step": 800
+    },
+    {
+      "epoch": 1.3,
+      "learning_rate": 9.673390970220942e-06,
+      "loss": 0.8036,
+      "step": 900
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 9.513288504642972e-06,
+      "loss": 0.7488,
+      "step": 1000
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 9.353186039065003e-06,
+      "loss": 0.6777,
+      "step": 1100
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 9.193083573487034e-06,
+      "loss": 0.6306,
+      "step": 1200
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 9.032981107909063e-06,
+      "loss": 0.5324,
+      "step": 1300
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8495244565217391,
+      "eval_loss": 0.6167322397232056,
+      "eval_runtime": 234.135,
+      "eval_samples_per_second": 25.148,
+      "eval_steps_per_second": 0.786,
+      "step": 1388
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 8.874479666986872e-06,
+      "loss": 0.5331,
+      "step": 1400
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 8.714377201408901e-06,
+      "loss": 0.3651,
+      "step": 1500
+    },
+    {
+      "epoch": 2.31,
+      "learning_rate": 8.554274735830932e-06,
+      "loss": 0.3298,
+      "step": 1600
+    },
+    {
+      "epoch": 2.45,
+      "learning_rate": 8.394172270252963e-06,
+      "loss": 0.3177,
+      "step": 1700
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 8.234069804674993e-06,
+      "loss": 0.3093,
+      "step": 1800
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 8.073967339097024e-06,
+      "loss": 0.317,
+      "step": 1900
+    },
+    {
+      "epoch": 2.88,
+      "learning_rate": 7.913864873519053e-06,
+      "loss": 0.3164,
+      "step": 2000
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.8678668478260869,
+      "eval_loss": 0.5136280655860901,
+      "eval_runtime": 234.6734,
+      "eval_samples_per_second": 25.09,
+      "eval_steps_per_second": 0.784,
+      "step": 2082
+    },
+    {
+      "epoch": 3.03,
+      "learning_rate": 7.753762407941084e-06,
+      "loss": 0.2798,
+      "step": 2100
+    },
+    {
+      "epoch": 3.17,
+      "learning_rate": 7.593659942363113e-06,
+      "loss": 0.1962,
+      "step": 2200
+    },
+    {
+      "epoch": 3.31,
+      "learning_rate": 7.4335574767851426e-06,
+      "loss": 0.1898,
+      "step": 2300
+    },
+    {
+      "epoch": 3.46,
+      "learning_rate": 7.2734550112071735e-06,
+      "loss": 0.1615,
+      "step": 2400
+    },
+    {
+      "epoch": 3.6,
+      "learning_rate": 7.113352545629203e-06,
+      "loss": 0.1534,
+      "step": 2500
+    },
+    {
+      "epoch": 3.75,
+      "learning_rate": 6.953250080051234e-06,
+      "loss": 0.162,
+      "step": 2600
+    },
+    {
+      "epoch": 3.89,
+      "learning_rate": 6.793147614473263e-06,
+      "loss": 0.1535,
+      "step": 2700
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.8758491847826086,
+      "eval_loss": 0.5263639092445374,
+      "eval_runtime": 233.6811,
+      "eval_samples_per_second": 25.197,
+      "eval_steps_per_second": 0.787,
+      "step": 2776
+    },
+    {
+      "epoch": 4.03,
+      "learning_rate": 6.633045148895294e-06,
+      "loss": 0.1458,
+      "step": 2800
+    },
+    {
+      "epoch": 4.18,
+      "learning_rate": 6.472942683317323e-06,
+      "loss": 0.1132,
+      "step": 2900
+    },
+    {
+      "epoch": 4.32,
+      "learning_rate": 6.3128402177393535e-06,
+      "loss": 0.1162,
+      "step": 3000
+    },
+    {
+      "epoch": 4.47,
+      "learning_rate": 6.152737752161384e-06,
+      "loss": 0.0797,
+      "step": 3100
+    },
+    {
+      "epoch": 4.61,
+      "learning_rate": 5.992635286583414e-06,
+      "loss": 0.0832,
+      "step": 3200
+    },
+    {
+      "epoch": 4.76,
+      "learning_rate": 5.832532821005445e-06,
+      "loss": 0.0759,
+      "step": 3300
+    },
+    {
+      "epoch": 4.9,
+      "learning_rate": 5.672430355427474e-06,
+      "loss": 0.1018,
+      "step": 3400
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.8766983695652174,
+      "eval_loss": 0.5890083909034729,
+      "eval_runtime": 236.5762,
+      "eval_samples_per_second": 24.888,
+      "eval_steps_per_second": 0.778,
+      "step": 3470
+    },
+    {
+      "epoch": 5.04,
+      "learning_rate": 5.512327889849503e-06,
+      "loss": 0.0816,
+      "step": 3500
+    },
+    {
+      "epoch": 5.19,
+      "learning_rate": 5.352225424271534e-06,
+      "loss": 0.0557,
+      "step": 3600
+    },
+    {
+      "epoch": 5.33,
+      "learning_rate": 5.1921229586935636e-06,
+      "loss": 0.0544,
+      "step": 3700
+    },
+    {
+      "epoch": 5.48,
+      "learning_rate": 5.0320204931155946e-06,
+      "loss": 0.045,
+      "step": 3800
+    },
+    {
+      "epoch": 5.62,
+      "learning_rate": 4.871918027537625e-06,
+      "loss": 0.0541,
+      "step": 3900
+    },
+    {
+      "epoch": 5.76,
+      "learning_rate": 4.713416586615434e-06,
+      "loss": 0.0656,
+      "step": 4000
+    },
+    {
+      "epoch": 5.91,
+      "learning_rate": 4.553314121037464e-06,
+      "loss": 0.0555,
+      "step": 4100
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8772078804347826,
+      "eval_loss": 0.612079381942749,
+      "eval_runtime": 232.3119,
+      "eval_samples_per_second": 25.345,
+      "eval_steps_per_second": 0.792,
+      "step": 4164
+    },
+    {
+      "epoch": 6.05,
+      "learning_rate": 4.393211655459494e-06,
+      "loss": 0.0439,
+      "step": 4200
+    },
+    {
+      "epoch": 6.2,
+      "learning_rate": 4.2331091898815245e-06,
+      "loss": 0.0234,
+      "step": 4300
+    },
+    {
+      "epoch": 6.34,
+      "learning_rate": 4.073006724303555e-06,
+      "loss": 0.035,
+      "step": 4400
+    },
+    {
+      "epoch": 6.48,
+      "learning_rate": 3.912904258725585e-06,
+      "loss": 0.0376,
+      "step": 4500
+    },
+    {
+      "epoch": 6.63,
+      "learning_rate": 3.7528017931476145e-06,
+      "loss": 0.0348,
+      "step": 4600
+    },
+    {
+      "epoch": 6.77,
+      "learning_rate": 3.5926993275696446e-06,
+      "loss": 0.0169,
+      "step": 4700
+    },
+    {
+      "epoch": 6.92,
+      "learning_rate": 3.432596861991675e-06,
+      "loss": 0.031,
+      "step": 4800
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.8777173913043478,
+      "eval_loss": 0.6623581051826477,
+      "eval_runtime": 235.7029,
+      "eval_samples_per_second": 24.981,
+      "eval_steps_per_second": 0.781,
+      "step": 4858
+    },
+    {
+      "epoch": 7.06,
+      "learning_rate": 3.2724943964137053e-06,
+      "loss": 0.0305,
+      "step": 4900
+    },
+    {
+      "epoch": 7.2,
+      "learning_rate": 3.1123919308357354e-06,
+      "loss": 0.0205,
+      "step": 5000
+    },
+    {
+      "epoch": 7.35,
+      "learning_rate": 2.952289465257765e-06,
+      "loss": 0.0239,
+      "step": 5100
+    },
+    {
+      "epoch": 7.49,
+      "learning_rate": 2.7921869996797953e-06,
+      "loss": 0.0224,
+      "step": 5200
+    },
+    {
+      "epoch": 7.64,
+      "learning_rate": 2.6320845341018254e-06,
+      "loss": 0.0187,
+      "step": 5300
+    },
+    {
+      "epoch": 7.78,
+      "learning_rate": 2.4719820685238555e-06,
+      "loss": 0.0125,
+      "step": 5400
+    },
+    {
+      "epoch": 7.93,
+      "learning_rate": 2.3118796029458857e-06,
+      "loss": 0.0264,
+      "step": 5500
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8868885869565217,
+      "eval_loss": 0.6172327995300293,
+      "eval_runtime": 233.4791,
+      "eval_samples_per_second": 25.219,
+      "eval_steps_per_second": 0.788,
+      "step": 5552
+    },
+    {
+      "epoch": 8.07,
+      "learning_rate": 2.1517771373679154e-06,
+      "loss": 0.013,
+      "step": 5600
+    },
+    {
+      "epoch": 8.21,
+      "learning_rate": 1.9916746717899455e-06,
+      "loss": 0.0145,
+      "step": 5700
+    },
+    {
+      "epoch": 8.36,
+      "learning_rate": 1.8315722062119759e-06,
+      "loss": 0.0146,
+      "step": 5800
+    },
+    {
+      "epoch": 8.5,
+      "learning_rate": 1.6714697406340058e-06,
+      "loss": 0.0127,
+      "step": 5900
+    },
+    {
+      "epoch": 8.65,
+      "learning_rate": 1.511367275056036e-06,
+      "loss": 0.0112,
+      "step": 6000
+    },
+    {
+      "epoch": 8.79,
+      "learning_rate": 1.351264809478066e-06,
+      "loss": 0.0115,
+      "step": 6100
+    },
+    {
+      "epoch": 8.93,
+      "learning_rate": 1.1911623439000962e-06,
+      "loss": 0.0079,
+      "step": 6200
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.8884171195652174,
+      "eval_loss": 0.6224890947341919,
+      "eval_runtime": 234.5344,
+      "eval_samples_per_second": 25.105,
+      "eval_steps_per_second": 0.785,
+      "step": 6246
+    },
+    {
+      "epoch": 9.08,
+      "learning_rate": 1.0310598783221263e-06,
+      "loss": 0.0073,
+      "step": 6300
+    },
+    {
+      "epoch": 9.22,
+      "learning_rate": 8.709574127441562e-07,
+      "loss": 0.0084,
+      "step": 6400
+    },
+    {
+      "epoch": 9.37,
+      "learning_rate": 7.108549471661865e-07,
+      "loss": 0.0034,
+      "step": 6500
+    },
+    {
+      "epoch": 9.51,
+      "learning_rate": 5.507524815882165e-07,
+      "loss": 0.0058,
+      "step": 6600
+    },
+    {
+      "epoch": 9.65,
+      "learning_rate": 3.906500160102466e-07,
+      "loss": 0.0048,
+      "step": 6700
+    },
+    {
+      "epoch": 9.8,
+      "learning_rate": 2.3054755043227666e-07,
+      "loss": 0.0063,
+      "step": 6800
+    },
+    {
+      "epoch": 9.94,
+      "learning_rate": 7.044508485430676e-08,
+      "loss": 0.0058,
+      "step": 6900
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.8897758152173914,
+      "eval_loss": 0.6338901519775391,
+      "eval_runtime": 234.8904,
+      "eval_samples_per_second": 25.067,
+      "eval_steps_per_second": 0.783,
+      "step": 6940
+    },
+    {
+      "epoch": 10.0,
+      "step": 6940,
+      "total_flos": 2.7871930756137603e+19,
+      "train_loss": 0.3924562724076362,
+      "train_runtime": 18647.2594,
+      "train_samples_per_second": 11.902,
+      "train_steps_per_second": 0.372
+    }
+  ],
+  "max_steps": 6940,
+  "num_train_epochs": 10,
+  "total_flos": 2.7871930756137603e+19,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c72e4781587bade3156e9c5f3816e2fc2aa8f7e2db9c8ca61f95867ce197b660
+size 3887