End of training

Browse files

Files changed (7) hide show

README.md +27 -27
config.json +10 -10
model.safetensors +1 -1
runs/Oct23_12-07-26_08287b92a2e8/events.out.tfevents.1729685247.08287b92a2e8.40887.7 +3 -0
runs/Oct23_12-18-21_08287b92a2e8/events.out.tfevents.1729685902.08287b92a2e8.40887.11 +3 -0
runs/Oct23_12-18-21_08287b92a2e8/events.out.tfevents.1729685999.08287b92a2e8.40887.12 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -1,13 +1,13 @@
 ---
-base_model: KennethEnevoldsen/dfm-sentence-encoder-large-exp2-no-lang-align
 library_name: transformers
 metrics:
 - accuracy
 - precision
 - recall
 - f1
-tags:
-- generated_from_trainer
 model-index:
 - name: dfm
   results: []
@@ -20,11 +20,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [KennethEnevoldsen/dfm-sentence-encoder-large-exp2-no-lang-align](https://huggingface.co/KennethEnevoldsen/dfm-sentence-encoder-large-exp2-no-lang-align) on the None dataset.
 It achieves the following results on the evaluation set:
-- Accuracy: 0.9421
-- Precision: 0.9470
-- Recall: 0.9421
-- F1: 0.9422
-- Loss: 0.5839
 ## Model description
@@ -58,25 +58,25 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch   | Step | Accuracy | Precision | Recall | F1     | Validation Loss |
 |:-------------:|:-------:|:----:|:--------:|:---------:|:------:|:------:|:---------------:|
-| No log        | 0.9412  | 8    | 0.8711   | 0.8341    | 0.8711 | 0.8507 | 0.4719          |
-| No log        | 2.0     | 17   | 0.9237   | 0.9242    | 0.9237 | 0.9217 | 0.3301          |
-| No log        | 2.9412  | 25   | 0.9225   | 0.9301    | 0.9225 | 0.9232 | 0.3470          |
-| No log        | 4.0     | 34   | 0.9317   | 0.9315    | 0.9317 | 0.9299 | 0.2004          |
-| No log        | 4.9412  | 42   | 0.9379   | 0.9443    | 0.9379 | 0.9383 | 0.4529          |
-| No log        | 6.0     | 51   | 0.9394   | 0.9454    | 0.9394 | 0.9399 | 0.4719          |
-| No log        | 6.9412  | 59   | 0.9425   | 0.9458    | 0.9425 | 0.9419 | 0.4498          |
-| No log        | 8.0     | 68   | 0.9421   | 0.9471    | 0.9421 | 0.9423 | 0.4921          |
-| No log        | 8.9412  | 76   | 0.9440   | 0.9486    | 0.9440 | 0.9440 | 0.5242          |
-| No log        | 10.0    | 85   | 0.9444   | 0.9488    | 0.9444 | 0.9443 | 0.5476          |
-| No log        | 10.9412 | 93   | 0.9421   | 0.9471    | 0.9421 | 0.9422 | 0.5733          |
-| No log        | 12.0    | 102  | 0.9432   | 0.9479    | 0.9432 | 0.9433 | 0.5725          |
-| No log        | 12.9412 | 110  | 0.9432   | 0.9478    | 0.9432 | 0.9432 | 0.5677          |
-| No log        | 14.0    | 119  | 0.9432   | 0.9478    | 0.9432 | 0.9432 | 0.5714          |
-| No log        | 14.9412 | 127  | 0.9425   | 0.9473    | 0.9425 | 0.9425 | 0.5802          |
-| No log        | 16.0    | 136  | 0.9417   | 0.9468    | 0.9417 | 0.9418 | 0.5838          |
-| No log        | 16.9412 | 144  | 0.9421   | 0.9470    | 0.9421 | 0.9422 | 0.5857          |
-| No log        | 18.0    | 153  | 0.9421   | 0.9470    | 0.9421 | 0.9422 | 0.5840          |
-| No log        | 18.8235 | 160  | 0.9421   | 0.9470    | 0.9421 | 0.9422 | 0.5839          |
 ### Framework versions

 ---
 library_name: transformers
+base_model: KennethEnevoldsen/dfm-sentence-encoder-large-exp2-no-lang-align
+tags:
+- generated_from_trainer
 metrics:
 - accuracy
 - precision
 - recall
 - f1
 model-index:
 - name: dfm
   results: []
 This model is a fine-tuned version of [KennethEnevoldsen/dfm-sentence-encoder-large-exp2-no-lang-align](https://huggingface.co/KennethEnevoldsen/dfm-sentence-encoder-large-exp2-no-lang-align) on the None dataset.
 It achieves the following results on the evaluation set:
+- Accuracy: 0.9417
+- Precision: 0.9468
+- Recall: 0.9417
+- F1: 0.9418
+- Loss: 0.4894
 ## Model description
 | Training Loss | Epoch   | Step | Accuracy | Precision | Recall | F1     | Validation Loss |
 |:-------------:|:-------:|:----:|:--------:|:---------:|:------:|:------:|:---------------:|
+| No log        | 0.9412  | 8    | 0.7223   | 0.7770    | 0.7223 | 0.7069 | 0.8079          |
+| No log        | 2.0     | 17   | 0.7821   | 0.8280    | 0.7821 | 0.7670 | 0.7157          |
+| No log        | 2.9412  | 25   | 0.9217   | 0.9243    | 0.9217 | 0.9174 | 0.3617          |
+| No log        | 4.0     | 34   | 0.9283   | 0.9331    | 0.9283 | 0.9272 | 0.3444          |
+| No log        | 4.9412  | 42   | 0.9156   | 0.9274    | 0.9156 | 0.9168 | 0.4618          |
+| No log        | 6.0     | 51   | 0.9271   | 0.9316    | 0.9271 | 0.9277 | 0.3164          |
+| No log        | 6.9412  | 59   | 0.9356   | 0.9387    | 0.9356 | 0.9349 | 0.3228          |
+| No log        | 8.0     | 68   | 0.9329   | 0.9398    | 0.9329 | 0.9334 | 0.4814          |
+| No log        | 8.9412  | 76   | 0.9402   | 0.9450    | 0.9402 | 0.9400 | 0.4819          |
+| No log        | 10.0    | 85   | 0.9409   | 0.9459    | 0.9409 | 0.9409 | 0.4952          |
+| No log        | 10.9412 | 93   | 0.9367   | 0.9428    | 0.9367 | 0.9370 | 0.5182          |
+| No log        | 12.0    | 102  | 0.9409   | 0.9462    | 0.9409 | 0.9411 | 0.4947          |
+| No log        | 12.9412 | 110  | 0.9405   | 0.9457    | 0.9405 | 0.9406 | 0.4927          |
+| No log        | 14.0    | 119  | 0.9409   | 0.9462    | 0.9409 | 0.9411 | 0.4912          |
+| No log        | 14.9412 | 127  | 0.9413   | 0.9465    | 0.9413 | 0.9414 | 0.4917          |
+| No log        | 16.0    | 136  | 0.9413   | 0.9464    | 0.9413 | 0.9415 | 0.4893          |
+| No log        | 16.9412 | 144  | 0.9413   | 0.9464    | 0.9413 | 0.9415 | 0.4890          |
+| No log        | 18.0    | 153  | 0.9417   | 0.9468    | 0.9417 | 0.9418 | 0.4893          |
+| No log        | 18.8235 | 160  | 0.9417   | 0.9468    | 0.9417 | 0.9418 | 0.4894          |
 ### Framework versions

config.json CHANGED Viewed

@@ -10,20 +10,20 @@
   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "id2label": {
-    "0": "O",
-    "1": "ST",
-    "2": "SM",
-    "3": "SP",
-    "4": "_"
   },
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "label2id": {
-    "O": 0,
-    "ST": 1,
-    "SM": 2,
-    "SP": 3,
-    "_": 4
   },
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,

   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "id2label": {
+    "0": "LABEL_0",
+    "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3",
+    "4": "LABEL_4"
   },
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "label2id": {
+    "LABEL_0": 0,
+    "LABEL_1": 1,
+    "LABEL_2": 2,
+    "LABEL_3": 3,
+    "LABEL_4": 4
   },
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:003d33f76a410852ef6d48ebe2ff12b18fe2ee0b259b8a6ea78be82c83e89c61
 size 1416218404

 version https://git-lfs.github.com/spec/v1
+oid sha256:0bf7ffc5a38d4ad76a8778993472d2c46beabeb3ff1a1be46ab4593999ba4681
 size 1416218404

runs/Oct23_12-07-26_08287b92a2e8/events.out.tfevents.1729685247.08287b92a2e8.40887.7 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93365fdc740a55ec10abd3532d3b188afd2c88d158108a4ba053080cdae11a23
+size 5403

runs/Oct23_12-18-21_08287b92a2e8/events.out.tfevents.1729685902.08287b92a2e8.40887.11 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7e4e5014e0fcb1b7f542bac98ecc7ca9c85a3b4d65bf37f462da01b0657ee77
+size 14512

runs/Oct23_12-18-21_08287b92a2e8/events.out.tfevents.1729685999.08287b92a2e8.40887.12 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:af0899f9b57d2dbf559ee3b21f1dcc7573d1ee2d1a2adb93d6ba84c470dc6a92
+size 560

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c16198da7ff65e77dab30111090fab65628f4b4c7c09910503f3502722bd53b1
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:074b9f52bb57b9c68f0f2260d2e40fcb63a34ab6b6314af5c5f4f91facaf7c02
 size 5240