Upload 9 files

Browse files

Files changed (10) hide show

.gitattributes +1 -0
config.json +162 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +15 -0
tokenizer.json +3 -0
tokenizer_config.json +20 -0
trainer_state.json +160 -0
training_args.bin +3 -0

.gitattributes CHANGED Viewed

@@ -32,3 +32,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

config.json ADDED Viewed

	@@ -0,0 +1,162 @@

+{
+  "_name_or_path": "xlm-roberta-large",
+  "architectures": [
+    "XLMRobertaForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4",
+    "5": "LABEL_5",
+    "6": "LABEL_6",
+    "7": "LABEL_7",
+    "8": "LABEL_8",
+    "9": "LABEL_9",
+    "10": "LABEL_10",
+    "11": "LABEL_11",
+    "12": "LABEL_12",
+    "13": "LABEL_13",
+    "14": "LABEL_14",
+    "15": "LABEL_15",
+    "16": "LABEL_16",
+    "17": "LABEL_17",
+    "18": "LABEL_18",
+    "19": "LABEL_19",
+    "20": "LABEL_20",
+    "21": "LABEL_21",
+    "22": "LABEL_22",
+    "23": "LABEL_23",
+    "24": "LABEL_24",
+    "25": "LABEL_25",
+    "26": "LABEL_26",
+    "27": "LABEL_27",
+    "28": "LABEL_28",
+    "29": "LABEL_29",
+    "30": "LABEL_30",
+    "31": "LABEL_31",
+    "32": "LABEL_32",
+    "33": "LABEL_33",
+    "34": "LABEL_34",
+    "35": "LABEL_35",
+    "36": "LABEL_36",
+    "37": "LABEL_37",
+    "38": "LABEL_38",
+    "39": "LABEL_39",
+    "40": "LABEL_40",
+    "41": "LABEL_41",
+    "42": "LABEL_42",
+    "43": "LABEL_43",
+    "44": "LABEL_44",
+    "45": "LABEL_45",
+    "46": "LABEL_46",
+    "47": "LABEL_47",
+    "48": "LABEL_48",
+    "49": "LABEL_49",
+    "50": "LABEL_50",
+    "51": "LABEL_51",
+    "52": "LABEL_52",
+    "53": "LABEL_53",
+    "54": "LABEL_54",
+    "55": "LABEL_55",
+    "56": "LABEL_56",
+    "57": "LABEL_57",
+    "58": "LABEL_58",
+    "59": "LABEL_59",
+    "60": "LABEL_60",
+    "61": "LABEL_61",
+    "62": "LABEL_62",
+    "63": "LABEL_63",
+    "64": "LABEL_64"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_10": 10,
+    "LABEL_11": 11,
+    "LABEL_12": 12,
+    "LABEL_13": 13,
+    "LABEL_14": 14,
+    "LABEL_15": 15,
+    "LABEL_16": 16,
+    "LABEL_17": 17,
+    "LABEL_18": 18,
+    "LABEL_19": 19,
+    "LABEL_2": 2,
+    "LABEL_20": 20,
+    "LABEL_21": 21,
+    "LABEL_22": 22,
+    "LABEL_23": 23,
+    "LABEL_24": 24,
+    "LABEL_25": 25,
+    "LABEL_26": 26,
+    "LABEL_27": 27,
+    "LABEL_28": 28,
+    "LABEL_29": 29,
+    "LABEL_3": 3,
+    "LABEL_30": 30,
+    "LABEL_31": 31,
+    "LABEL_32": 32,
+    "LABEL_33": 33,
+    "LABEL_34": 34,
+    "LABEL_35": 35,
+    "LABEL_36": 36,
+    "LABEL_37": 37,
+    "LABEL_38": 38,
+    "LABEL_39": 39,
+    "LABEL_4": 4,
+    "LABEL_40": 40,
+    "LABEL_41": 41,
+    "LABEL_42": 42,
+    "LABEL_43": 43,
+    "LABEL_44": 44,
+    "LABEL_45": 45,
+    "LABEL_46": 46,
+    "LABEL_47": 47,
+    "LABEL_48": 48,
+    "LABEL_49": 49,
+    "LABEL_5": 5,
+    "LABEL_50": 50,
+    "LABEL_51": 51,
+    "LABEL_52": 52,
+    "LABEL_53": 53,
+    "LABEL_54": 54,
+    "LABEL_55": 55,
+    "LABEL_56": 56,
+    "LABEL_57": 57,
+    "LABEL_58": 58,
+    "LABEL_59": 59,
+    "LABEL_6": 6,
+    "LABEL_60": 60,
+    "LABEL_61": 61,
+    "LABEL_62": 62,
+    "LABEL_63": 63,
+    "LABEL_64": 64,
+    "LABEL_7": 7,
+    "LABEL_8": 8,
+    "LABEL_9": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a6d95d650ef51a527c898cdcb1f657f6a74f2dee3ba2047be3f11dc02d0022b0
+size 2235766385

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1dd5f46a018cf368b1dad18c07c0690065d8fa88ba9cc6083a390290c06213d5
+size 21579

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4015cdb5ec973cb4a90adabc352a0271a90d07a6e2e49428732f3c2d0e4d7318
+size 623

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f2c509a525eb51aebb33fb59c24ee923c1d4c1db23c3ae81fe05ccf354084f7b
+size 17082758

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 512,
+  "name_or_path": "xlm-roberta-large",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,160 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 10.0,
+  "global_step": 2330,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8702409035670884,
+      "eval_f1": 0.2995999407319603,
+      "eval_loss": 0.5389052033424377,
+      "eval_precision": 0.33331959612610756,
+      "eval_recall": 0.27207589060450094,
+      "eval_runtime": 14.1196,
+      "eval_samples_per_second": 1054.99,
+      "eval_steps_per_second": 2.125,
+      "step": 233
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9681749946386446,
+      "eval_f1": 0.8514915583419936,
+      "eval_loss": 0.12146873772144318,
+      "eval_precision": 0.8626164998274076,
+      "eval_recall": 0.8406499142193965,
+      "eval_runtime": 15.0925,
+      "eval_samples_per_second": 986.983,
+      "eval_steps_per_second": 1.988,
+      "step": 466
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 6.25e-06,
+      "loss": 1.2635,
+      "step": 500
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9790478232897276,
+      "eval_f1": 0.9141998345125719,
+      "eval_loss": 0.0771816298365593,
+      "eval_precision": 0.9178421266784212,
+      "eval_recall": 0.9105863356544556,
+      "eval_runtime": 14.0091,
+      "eval_samples_per_second": 1063.307,
+      "eval_steps_per_second": 2.141,
+      "step": 699
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.98271141611266,
+      "eval_f1": 0.9309382867251821,
+      "eval_loss": 0.06554248929023743,
+      "eval_precision": 0.9416055882454148,
+      "eval_recall": 0.9205099740976217,
+      "eval_runtime": 14.0197,
+      "eval_samples_per_second": 1062.501,
+      "eval_steps_per_second": 2.14,
+      "step": 932
+    },
+    {
+      "epoch": 4.29,
+      "learning_rate": 8.69281045751634e-06,
+      "loss": 0.0906,
+      "step": 1000
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.984880977911216,
+      "eval_f1": 0.9419223941161552,
+      "eval_loss": 0.06115253269672394,
+      "eval_precision": 0.9468692637160921,
+      "eval_recall": 0.9370269452013321,
+      "eval_runtime": 14.0288,
+      "eval_samples_per_second": 1061.817,
+      "eval_steps_per_second": 2.138,
+      "step": 1165
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9843269711916506,
+      "eval_f1": 0.9446501919062689,
+      "eval_loss": 0.062205445021390915,
+      "eval_precision": 0.9454459682582471,
+      "eval_recall": 0.9438557540283244,
+      "eval_runtime": 14.4851,
+      "eval_samples_per_second": 1028.367,
+      "eval_steps_per_second": 2.071,
+      "step": 1398
+    },
+    {
+      "epoch": 6.44,
+      "learning_rate": 5.4248366013071894e-06,
+      "loss": 0.0429,
+      "step": 1500
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.9854850239473872,
+      "eval_f1": 0.9466268938436389,
+      "eval_loss": 0.06088804826140404,
+      "eval_precision": 0.9484971293481932,
+      "eval_recall": 0.9447640192417668,
+      "eval_runtime": 14.327,
+      "eval_samples_per_second": 1039.716,
+      "eval_steps_per_second": 2.094,
+      "step": 1631
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9853885195510759,
+      "eval_f1": 0.9475256832068758,
+      "eval_loss": 0.06388872861862183,
+      "eval_precision": 0.9456525381135868,
+      "eval_recall": 0.9494062636660275,
+      "eval_runtime": 14.5864,
+      "eval_samples_per_second": 1021.225,
+      "eval_steps_per_second": 2.057,
+      "step": 1864
+    },
+    {
+      "epoch": 8.58,
+      "learning_rate": 2.1568627450980393e-06,
+      "loss": 0.0265,
+      "step": 2000
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.9858710415326328,
+      "eval_f1": 0.9485348353785288,
+      "eval_loss": 0.06375858187675476,
+      "eval_precision": 0.9453968253968253,
+      "eval_recall": 0.9516937464258082,
+      "eval_runtime": 14.1094,
+      "eval_samples_per_second": 1055.751,
+      "eval_steps_per_second": 2.126,
+      "step": 2097
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.9859925655872471,
+      "eval_f1": 0.949012494961709,
+      "eval_loss": 0.06480085104703903,
+      "eval_precision": 0.9475802394607103,
+      "eval_recall": 0.9504490866888687,
+      "eval_runtime": 13.7245,
+      "eval_samples_per_second": 1085.359,
+      "eval_steps_per_second": 2.186,
+      "step": 2330
+    }
+  ],
+  "max_steps": 2330,
+  "num_train_epochs": 10,
+  "total_flos": 1.6349634872247114e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dd8a00aa1635f17eb171e09f3e680880d6cdbba456e917c1919a2eee40427010
+size 3503