Markus Serloth-Schwarzer commited on May 10

Commit

5e7d631

•

1 Parent(s): 55922ae

Upload folder using huggingface_hub

Browse files

Files changed (18) hide show

README.md +37 -0
checkpoint-358/config.json +38 -0
checkpoint-358/model.safetensors +3 -0
checkpoint-358/optimizer.pt +3 -0
checkpoint-358/rng_state.pth +3 -0
checkpoint-358/scheduler.pt +3 -0
checkpoint-358/trainer_state.json +414 -0
checkpoint-358/training_args.bin +3 -0
config.json +38 -0
model.safetensors +3 -0
runs/May10_10-14-34_r-zerithas-myownmodels-v1-dexn9dxn-56f58-vn01a/events.out.tfevents.1715336075.r-zerithas-myownmodels-v1-dexn9dxn-56f58-vn01a.61.0 +2 -2
runs/May10_10-14-34_r-zerithas-myownmodels-v1-dexn9dxn-56f58-vn01a/events.out.tfevents.1715336180.r-zerithas-myownmodels-v1-dexn9dxn-56f58-vn01a.61.1 +3 -0
special_tokens_map.json +7 -0
tokenizer.json +0 -0
tokenizer_config.json +57 -0
training_args.bin +3 -0
training_params.json +28 -0
vocab.txt +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,37 @@

+---
+tags:
+- autotrain
+- text-classification
+widget:
+- text: "I love AutoTrain"
+datasets:
+- autotrain-df1900/autotrain-data
+---
+# Model Trained Using AutoTrain
+- Problem type: Text Classification
+## Validation Metrics
+loss: 0.5813801884651184
+f1_macro: 0.7260922298411884
+f1_micro: 0.7555555555555555
+f1_weighted: 0.7572122427440394
+precision_macro: 0.8363530342788121
+precision_micro: 0.7555555555555555
+precision_weighted: 0.787079051704817
+recall_macro: 0.6883138463397686
+recall_micro: 0.7555555555555555
+recall_weighted: 0.7555555555555555
+accuracy: 0.7555555555555555

checkpoint-358/config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "oliverguhr/german-sentiment-bert",
+  "_num_labels": 3,
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "finetuning_task": "germansentiment",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "negative",
+    "1": "neutral",
+    "2": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "negative": 0,
+    "neutral": 1,
+    "positive": 2
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.40.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30000
+}

checkpoint-358/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24fba2b6ab75eb6802621bcdda26edaad8bb3513ace8d4f08cd25756e0317eac
+size 436358132

checkpoint-358/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d292337b8ca5fb78b7e8bc7d8b5761e43737d99405ee88bd376d1a0a415c0346
+size 872837370

checkpoint-358/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77a91a1e219bba43507a1274dfd27d4d9a8bbd8422c54cafd6ede13bb9de2e25
+size 14244

checkpoint-358/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ad4a0db14e6b35369ed3a769d4643f789d6102896ccfb8b46d2a6f25646f335
+size 1064

checkpoint-358/trainer_state.json ADDED Viewed

	@@ -0,0 +1,414 @@

+{
+  "best_metric": 0.5813801884651184,
+  "best_model_checkpoint": "autotrain-df1900/checkpoint-358",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 358,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.03910614525139665,
+      "grad_norm": Infinity,
+      "learning_rate": 1.6666666666666667e-06,
+      "loss": 2.7904,
+      "step": 7
+    },
+    {
+      "epoch": 0.0782122905027933,
+      "grad_norm": 25.788576126098633,
+      "learning_rate": 5.555555555555556e-06,
+      "loss": 2.8667,
+      "step": 14
+    },
+    {
+      "epoch": 0.11731843575418995,
+      "grad_norm": 81.24959564208984,
+      "learning_rate": 9.444444444444445e-06,
+      "loss": 1.4322,
+      "step": 21
+    },
+    {
+      "epoch": 0.1564245810055866,
+      "grad_norm": 58.19857406616211,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 1.3935,
+      "step": 28
+    },
+    {
+      "epoch": 0.19553072625698323,
+      "grad_norm": 30.410076141357422,
+      "learning_rate": 1.7222222222222224e-05,
+      "loss": 1.8371,
+      "step": 35
+    },
+    {
+      "epoch": 0.2346368715083799,
+      "grad_norm": 18.535837173461914,
+      "learning_rate": 2.111111111111111e-05,
+      "loss": 1.099,
+      "step": 42
+    },
+    {
+      "epoch": 0.2737430167597765,
+      "grad_norm": 22.98031234741211,
+      "learning_rate": 2.5e-05,
+      "loss": 0.9875,
+      "step": 49
+    },
+    {
+      "epoch": 0.3128491620111732,
+      "grad_norm": 11.425638198852539,
+      "learning_rate": 2.8888888888888888e-05,
+      "loss": 0.8133,
+      "step": 56
+    },
+    {
+      "epoch": 0.35195530726256985,
+      "grad_norm": 5.045665264129639,
+      "learning_rate": 3.277777777777778e-05,
+      "loss": 0.8904,
+      "step": 63
+    },
+    {
+      "epoch": 0.39106145251396646,
+      "grad_norm": 12.486892700195312,
+      "learning_rate": 3.6666666666666666e-05,
+      "loss": 0.7414,
+      "step": 70
+    },
+    {
+      "epoch": 0.4301675977653631,
+      "grad_norm": 3.167890787124634,
+      "learning_rate": 4.055555555555556e-05,
+      "loss": 0.7626,
+      "step": 77
+    },
+    {
+      "epoch": 0.4692737430167598,
+      "grad_norm": 6.028005123138428,
+      "learning_rate": 4.4444444444444447e-05,
+      "loss": 0.7398,
+      "step": 84
+    },
+    {
+      "epoch": 0.5083798882681564,
+      "grad_norm": 35.28788375854492,
+      "learning_rate": 4.8333333333333334e-05,
+      "loss": 0.7538,
+      "step": 91
+    },
+    {
+      "epoch": 0.547486033519553,
+      "grad_norm": 6.1644287109375,
+      "learning_rate": 4.975155279503106e-05,
+      "loss": 0.7904,
+      "step": 98
+    },
+    {
+      "epoch": 0.5865921787709497,
+      "grad_norm": 4.832672595977783,
+      "learning_rate": 4.93167701863354e-05,
+      "loss": 0.6236,
+      "step": 105
+    },
+    {
+      "epoch": 0.6256983240223464,
+      "grad_norm": 5.062296390533447,
+      "learning_rate": 4.888198757763975e-05,
+      "loss": 0.6016,
+      "step": 112
+    },
+    {
+      "epoch": 0.664804469273743,
+      "grad_norm": 6.538865566253662,
+      "learning_rate": 4.8447204968944106e-05,
+      "loss": 0.683,
+      "step": 119
+    },
+    {
+      "epoch": 0.7039106145251397,
+      "grad_norm": 12.783892631530762,
+      "learning_rate": 4.801242236024845e-05,
+      "loss": 0.5875,
+      "step": 126
+    },
+    {
+      "epoch": 0.7430167597765364,
+      "grad_norm": 15.942752838134766,
+      "learning_rate": 4.75776397515528e-05,
+      "loss": 0.7539,
+      "step": 133
+    },
+    {
+      "epoch": 0.7821229050279329,
+      "grad_norm": 12.102270126342773,
+      "learning_rate": 4.714285714285714e-05,
+      "loss": 0.6436,
+      "step": 140
+    },
+    {
+      "epoch": 0.8212290502793296,
+      "grad_norm": 12.194900512695312,
+      "learning_rate": 4.67080745341615e-05,
+      "loss": 0.6753,
+      "step": 147
+    },
+    {
+      "epoch": 0.8603351955307262,
+      "grad_norm": 4.499144554138184,
+      "learning_rate": 4.627329192546584e-05,
+      "loss": 0.6427,
+      "step": 154
+    },
+    {
+      "epoch": 0.8994413407821229,
+      "grad_norm": 37.82847213745117,
+      "learning_rate": 4.5838509316770186e-05,
+      "loss": 0.5532,
+      "step": 161
+    },
+    {
+      "epoch": 0.9385474860335196,
+      "grad_norm": 8.265608787536621,
+      "learning_rate": 4.5403726708074534e-05,
+      "loss": 0.6255,
+      "step": 168
+    },
+    {
+      "epoch": 0.9776536312849162,
+      "grad_norm": 20.247652053833008,
+      "learning_rate": 4.496894409937888e-05,
+      "loss": 0.762,
+      "step": 175
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6888888888888889,
+      "eval_f1_macro": 0.6134364066324626,
+      "eval_f1_micro": 0.6888888888888889,
+      "eval_f1_weighted": 0.6556718302095907,
+      "eval_loss": 0.632859468460083,
+      "eval_precision_macro": 0.6388557048835793,
+      "eval_precision_micro": 0.6888888888888889,
+      "eval_precision_weighted": 0.7150407820890647,
+      "eval_recall_macro": 0.7103749357986646,
+      "eval_recall_micro": 0.6888888888888889,
+      "eval_recall_weighted": 0.6888888888888889,
+      "eval_runtime": 0.8253,
+      "eval_samples_per_second": 381.666,
+      "eval_steps_per_second": 24.233,
+      "step": 179
+    },
+    {
+      "epoch": 1.0167597765363128,
+      "grad_norm": 13.096763610839844,
+      "learning_rate": 4.453416149068323e-05,
+      "loss": 0.6157,
+      "step": 182
+    },
+    {
+      "epoch": 1.0558659217877095,
+      "grad_norm": 3.1911122798919678,
+      "learning_rate": 4.409937888198758e-05,
+      "loss": 0.4914,
+      "step": 189
+    },
+    {
+      "epoch": 1.094972067039106,
+      "grad_norm": 4.951513767242432,
+      "learning_rate": 4.366459627329193e-05,
+      "loss": 0.6149,
+      "step": 196
+    },
+    {
+      "epoch": 1.1340782122905029,
+      "grad_norm": 33.5722770690918,
+      "learning_rate": 4.322981366459627e-05,
+      "loss": 0.4134,
+      "step": 203
+    },
+    {
+      "epoch": 1.1731843575418994,
+      "grad_norm": 14.286345481872559,
+      "learning_rate": 4.279503105590063e-05,
+      "loss": 0.6698,
+      "step": 210
+    },
+    {
+      "epoch": 1.2122905027932962,
+      "grad_norm": 14.875500679016113,
+      "learning_rate": 4.236024844720497e-05,
+      "loss": 0.5168,
+      "step": 217
+    },
+    {
+      "epoch": 1.2513966480446927,
+      "grad_norm": 12.584643363952637,
+      "learning_rate": 4.192546583850932e-05,
+      "loss": 0.4729,
+      "step": 224
+    },
+    {
+      "epoch": 1.2905027932960893,
+      "grad_norm": 17.89870834350586,
+      "learning_rate": 4.1490683229813665e-05,
+      "loss": 0.5877,
+      "step": 231
+    },
+    {
+      "epoch": 1.329608938547486,
+      "grad_norm": 21.653051376342773,
+      "learning_rate": 4.105590062111801e-05,
+      "loss": 0.5799,
+      "step": 238
+    },
+    {
+      "epoch": 1.3687150837988826,
+      "grad_norm": 14.669210433959961,
+      "learning_rate": 4.062111801242236e-05,
+      "loss": 0.6727,
+      "step": 245
+    },
+    {
+      "epoch": 1.4078212290502794,
+      "grad_norm": 48.661590576171875,
+      "learning_rate": 4.018633540372671e-05,
+      "loss": 0.3173,
+      "step": 252
+    },
+    {
+      "epoch": 1.446927374301676,
+      "grad_norm": 9.906561851501465,
+      "learning_rate": 3.9751552795031056e-05,
+      "loss": 0.4626,
+      "step": 259
+    },
+    {
+      "epoch": 1.4860335195530725,
+      "grad_norm": 10.801528930664062,
+      "learning_rate": 3.9316770186335404e-05,
+      "loss": 0.4253,
+      "step": 266
+    },
+    {
+      "epoch": 1.5251396648044693,
+      "grad_norm": 9.928108215332031,
+      "learning_rate": 3.888198757763976e-05,
+      "loss": 0.4709,
+      "step": 273
+    },
+    {
+      "epoch": 1.564245810055866,
+      "grad_norm": 14.68846321105957,
+      "learning_rate": 3.84472049689441e-05,
+      "loss": 0.6013,
+      "step": 280
+    },
+    {
+      "epoch": 1.6033519553072626,
+      "grad_norm": 17.944059371948242,
+      "learning_rate": 3.801242236024845e-05,
+      "loss": 0.5292,
+      "step": 287
+    },
+    {
+      "epoch": 1.6424581005586592,
+      "grad_norm": 18.032865524291992,
+      "learning_rate": 3.7577639751552796e-05,
+      "loss": 0.6594,
+      "step": 294
+    },
+    {
+      "epoch": 1.6815642458100557,
+      "grad_norm": 17.491785049438477,
+      "learning_rate": 3.7142857142857143e-05,
+      "loss": 0.5479,
+      "step": 301
+    },
+    {
+      "epoch": 1.7206703910614525,
+      "grad_norm": 6.0670084953308105,
+      "learning_rate": 3.670807453416149e-05,
+      "loss": 0.5482,
+      "step": 308
+    },
+    {
+      "epoch": 1.7597765363128492,
+      "grad_norm": 8.272087097167969,
+      "learning_rate": 3.627329192546584e-05,
+      "loss": 0.6121,
+      "step": 315
+    },
+    {
+      "epoch": 1.7988826815642458,
+      "grad_norm": 17.894323348999023,
+      "learning_rate": 3.583850931677019e-05,
+      "loss": 0.3687,
+      "step": 322
+    },
+    {
+      "epoch": 1.8379888268156424,
+      "grad_norm": 11.107515335083008,
+      "learning_rate": 3.5403726708074535e-05,
+      "loss": 0.3551,
+      "step": 329
+    },
+    {
+      "epoch": 1.8770949720670391,
+      "grad_norm": 12.939613342285156,
+      "learning_rate": 3.496894409937889e-05,
+      "loss": 0.5203,
+      "step": 336
+    },
+    {
+      "epoch": 1.916201117318436,
+      "grad_norm": 11.045318603515625,
+      "learning_rate": 3.453416149068323e-05,
+      "loss": 0.5056,
+      "step": 343
+    },
+    {
+      "epoch": 1.9553072625698324,
+      "grad_norm": 16.073732376098633,
+      "learning_rate": 3.409937888198758e-05,
+      "loss": 0.3774,
+      "step": 350
+    },
+    {
+      "epoch": 1.994413407821229,
+      "grad_norm": 12.492730140686035,
+      "learning_rate": 3.3664596273291926e-05,
+      "loss": 0.5519,
+      "step": 357
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.7555555555555555,
+      "eval_f1_macro": 0.7260922298411884,
+      "eval_f1_micro": 0.7555555555555555,
+      "eval_f1_weighted": 0.7572122427440394,
+      "eval_loss": 0.5813801884651184,
+      "eval_precision_macro": 0.8363530342788121,
+      "eval_precision_micro": 0.7555555555555555,
+      "eval_precision_weighted": 0.787079051704817,
+      "eval_recall_macro": 0.6883138463397686,
+      "eval_recall_micro": 0.7555555555555555,
+      "eval_recall_weighted": 0.7555555555555555,
+      "eval_runtime": 0.8409,
+      "eval_samples_per_second": 374.583,
+      "eval_steps_per_second": 23.783,
+      "step": 358
+    }
+  ],
+  "logging_steps": 7,
+  "max_steps": 895,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 188389207093248.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-358/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd0eb0b731cb682988c35717b74d8d6cc3c2a1adb35290047114f8a66f952124
+size 5048

config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "oliverguhr/german-sentiment-bert",
+  "_num_labels": 3,
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "finetuning_task": "germansentiment",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "negative",
+    "1": "neutral",
+    "2": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "negative": 0,
+    "neutral": 1,
+    "positive": 2
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.40.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30000
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24fba2b6ab75eb6802621bcdda26edaad8bb3513ace8d4f08cd25756e0317eac
+size 436358132

runs/May10_10-14-34_r-zerithas-myownmodels-v1-dexn9dxn-56f58-vn01a/events.out.tfevents.1715336075.r-zerithas-myownmodels-v1-dexn9dxn-56f58-vn01a.61.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fbadd7a3782107719b0b21b49300f69cbd3dbd70e80f9056e85e097799425628
-size 4905

 version https://git-lfs.github.com/spec/v1
+oid sha256:83baf5f32d07db86c82904d7534e08ef8cf8c34b4a1e4b9f16c2330015e1d236
+size 36149

runs/May10_10-14-34_r-zerithas-myownmodels-v1-dexn9dxn-56f58-vn01a/events.out.tfevents.1715336180.r-zerithas-myownmodels-v1-dexn9dxn-56f58-vn01a.61.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2b9aafeb9388f4e6df84e203a802ee6b0f8888d70a247b57407032d2626a4ecb
+size 921

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "5": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd0eb0b731cb682988c35717b74d8d6cc3c2a1adb35290047114f8a66f952124
+size 5048

training_params.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+    "data_path": "autotrain-df1900/autotrain-data",
+    "model": "oliverguhr/german-sentiment-bert",
+    "lr": 5e-05,
+    "epochs": 5,
+    "max_seq_length": 128,
+    "batch_size": 8,
+    "warmup_ratio": 0.1,
+    "gradient_accumulation": 1,
+    "optimizer": "adamw_torch",
+    "scheduler": "linear",
+    "weight_decay": 0.0,
+    "max_grad_norm": 1.0,
+    "seed": 42,
+    "train_split": "train",
+    "valid_split": "validation",
+    "text_column": "autotrain_text",
+    "target_column": "autotrain_label",
+    "logging_steps": -1,
+    "project_name": "autotrain-df1900",
+    "auto_find_batch_size": false,
+    "mixed_precision": "fp16",
+    "save_total_limit": 1,
+    "push_to_hub": true,
+    "evaluation_strategy": "epoch",
+    "username": "Zerithas",
+    "log": "tensorboard"
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff