beenakurian commited on Mar 18

Commit

424ad22

•

1 Parent(s): 11d109c

Upload folder using huggingface_hub

Browse files

Files changed (17) hide show

README.md +37 -0
added_tokens.json +3 -0
bpe.codes +0 -0
checkpoint-691/config.json +41 -0
checkpoint-691/model.safetensors +3 -0
checkpoint-691/optimizer.pt +3 -0
checkpoint-691/rng_state.pth +3 -0
checkpoint-691/scheduler.pt +3 -0
checkpoint-691/trainer_state.json +179 -0
checkpoint-691/training_args.bin +3 -0
config.json +41 -0
model.safetensors +3 -0
special_tokens_map.json +9 -0
tokenizer_config.json +55 -0
training_args.bin +3 -0
training_params.json +30 -0
vocab.txt +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,37 @@

+---
+tags:
+- autotrain
+- text-classification
+widget:
+- text: "I love AutoTrain"
+datasets:
+- autotrain-sentiment-analyzer-reddit/autotrain-data
+---
+# Model Trained Using AutoTrain
+- Problem type: Text Classification
+## Validation Metrics
+loss: 0.4894636273384094
+f1_macro: 0.7895193987806856
+f1_micro: 0.8096960926193921
+f1_weighted: 0.8045465713974906
+precision_macro: 0.814875613105015
+precision_micro: 0.8096960926193922
+precision_weighted: 0.8193628961020867
+recall_macro: 0.7801134533159866
+recall_micro: 0.8096960926193922
+recall_weighted: 0.8096960926193922
+accuracy: 0.8096960926193922

added_tokens.json ADDED Viewed

	@@ -0,0 +1,3 @@

+{
+  "<mask>": 64000
+}

bpe.codes ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-691/config.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+  "_name_or_path": "finiteautomata/bertweet-base-sentiment-analysis",
+  "_num_labels": 3,
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "NEG",
+    "1": "NEU",
+    "2": "POS"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "NEG": 0,
+    "NEU": 1,
+    "POS": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 130,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "tokenizer_class": "BertweetTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 64001
+}

checkpoint-691/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1eb5282f974dabdbb97377653de6ca8ff20b8497ca563b8bbb273dfd5e9ff531
+size 539633244

checkpoint-691/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b5399c0b3df05d64f2dfc07571fbf1daaff1b126325eef6fdae65d5ab18c59b
+size 1079380730

checkpoint-691/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9729bf650c019e169cc416f0139045e4b75207e0d9685d805e7fdf86cbdd3f56
+size 13990

checkpoint-691/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3cbcde868192164270ef8ff85c0810e999171168031361951c09b19e2f39841d
+size 1064

checkpoint-691/trainer_state.json ADDED Viewed

	@@ -0,0 +1,179 @@

+{
+  "best_metric": 0.4894636273384094,
+  "best_model_checkpoint": "autotrain-sentiment-analyzer-reddit/checkpoint-691",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 691,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "grad_norm": 10.44394588470459,
+      "learning_rate": 8.173076923076923e-06,
+      "loss": 0.3149,
+      "step": 34
+    },
+    {
+      "epoch": 0.1,
+      "grad_norm": 12.510290145874023,
+      "learning_rate": 1.6346153846153847e-05,
+      "loss": 0.3768,
+      "step": 68
+    },
+    {
+      "epoch": 0.15,
+      "grad_norm": 10.982364654541016,
+      "learning_rate": 2.4519230769230768e-05,
+      "loss": 0.3113,
+      "step": 102
+    },
+    {
+      "epoch": 0.2,
+      "grad_norm": 14.942676544189453,
+      "learning_rate": 3.269230769230769e-05,
+      "loss": 0.4581,
+      "step": 136
+    },
+    {
+      "epoch": 0.25,
+      "grad_norm": 15.461087226867676,
+      "learning_rate": 4.0865384615384615e-05,
+      "loss": 0.5979,
+      "step": 170
+    },
+    {
+      "epoch": 0.3,
+      "grad_norm": 51.596256256103516,
+      "learning_rate": 4.9038461538461536e-05,
+      "loss": 0.548,
+      "step": 204
+    },
+    {
+      "epoch": 0.34,
+      "grad_norm": 21.773590087890625,
+      "learning_rate": 4.9195710455764076e-05,
+      "loss": 0.5489,
+      "step": 238
+    },
+    {
+      "epoch": 0.39,
+      "grad_norm": 11.456461906433105,
+      "learning_rate": 4.8284182305630025e-05,
+      "loss": 0.6068,
+      "step": 272
+    },
+    {
+      "epoch": 0.44,
+      "grad_norm": 15.925763130187988,
+      "learning_rate": 4.737265415549598e-05,
+      "loss": 0.5067,
+      "step": 306
+    },
+    {
+      "epoch": 0.49,
+      "grad_norm": 15.808685302734375,
+      "learning_rate": 4.6461126005361935e-05,
+      "loss": 0.5312,
+      "step": 340
+    },
+    {
+      "epoch": 0.54,
+      "grad_norm": 53.43648910522461,
+      "learning_rate": 4.554959785522788e-05,
+      "loss": 0.4574,
+      "step": 374
+    },
+    {
+      "epoch": 0.59,
+      "grad_norm": 4.778822898864746,
+      "learning_rate": 4.463806970509384e-05,
+      "loss": 0.6492,
+      "step": 408
+    },
+    {
+      "epoch": 0.64,
+      "grad_norm": 9.234722137451172,
+      "learning_rate": 4.3726541554959786e-05,
+      "loss": 0.6046,
+      "step": 442
+    },
+    {
+      "epoch": 0.69,
+      "grad_norm": 8.603498458862305,
+      "learning_rate": 4.281501340482574e-05,
+      "loss": 0.5429,
+      "step": 476
+    },
+    {
+      "epoch": 0.74,
+      "grad_norm": 23.032926559448242,
+      "learning_rate": 4.1903485254691696e-05,
+      "loss": 0.5069,
+      "step": 510
+    },
+    {
+      "epoch": 0.79,
+      "grad_norm": 3.559593915939331,
+      "learning_rate": 4.0991957104557644e-05,
+      "loss": 0.5562,
+      "step": 544
+    },
+    {
+      "epoch": 0.84,
+      "grad_norm": 14.31966495513916,
+      "learning_rate": 4.008042895442359e-05,
+      "loss": 0.4328,
+      "step": 578
+    },
+    {
+      "epoch": 0.89,
+      "grad_norm": 16.031381607055664,
+      "learning_rate": 3.916890080428954e-05,
+      "loss": 0.5084,
+      "step": 612
+    },
+    {
+      "epoch": 0.93,
+      "grad_norm": 6.348935127258301,
+      "learning_rate": 3.8257372654155496e-05,
+      "loss": 0.5242,
+      "step": 646
+    },
+    {
+      "epoch": 0.98,
+      "grad_norm": 20.074831008911133,
+      "learning_rate": 3.734584450402145e-05,
+      "loss": 0.5023,
+      "step": 680
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8096960926193922,
+      "eval_f1_macro": 0.7895193987806856,
+      "eval_f1_micro": 0.8096960926193921,
+      "eval_f1_weighted": 0.8045465713974906,
+      "eval_loss": 0.4894636273384094,
+      "eval_precision_macro": 0.814875613105015,
+      "eval_precision_micro": 0.8096960926193922,
+      "eval_precision_weighted": 0.8193628961020867,
+      "eval_recall_macro": 0.7801134533159866,
+      "eval_recall_micro": 0.8096960926193922,
+      "eval_recall_weighted": 0.8096960926193922,
+      "eval_runtime": 321.1321,
+      "eval_samples_per_second": 4.304,
+      "eval_steps_per_second": 0.271,
+      "step": 691
+    }
+  ],
+  "logging_steps": 34,
+  "max_steps": 2073,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "total_flos": 363491186591232.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-691/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25073ad33de1cc150e6d09207726f9585f650b1108f1b100b5189c72f2a36abf
+size 4984

config.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+  "_name_or_path": "finiteautomata/bertweet-base-sentiment-analysis",
+  "_num_labels": 3,
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "NEG",
+    "1": "NEU",
+    "2": "POS"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "NEG": 0,
+    "NEU": 1,
+    "POS": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 130,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "tokenizer_class": "BertweetTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 64001
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1eb5282f974dabdbb97377653de6ca8ff20b8497ca563b8bbb273dfd5e9ff531
+size 539633244

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "64000": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": "<mask>",
+  "model_max_length": 128,
+  "normalization": false,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "BertweetTokenizer",
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25073ad33de1cc150e6d09207726f9585f650b1108f1b100b5189c72f2a36abf
+size 4984

training_params.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+    "data_path": "autotrain-sentiment-analyzer-reddit/autotrain-data",
+    "model": "finiteautomata/bertweet-base-sentiment-analysis",
+    "lr": 5e-05,
+    "epochs": 3,
+    "max_seq_length": 128,
+    "batch_size": 8,
+    "warmup_ratio": 0.1,
+    "gradient_accumulation": 1,
+    "optimizer": "adamw_torch",
+    "scheduler": "linear",
+    "weight_decay": 0.0,
+    "max_grad_norm": 1.0,
+    "seed": 42,
+    "train_split": "train",
+    "valid_split": "validation",
+    "text_column": "autotrain_text",
+    "target_column": "autotrain_label",
+    "logging_steps": -1,
+    "project_name": "autotrain-sentiment-analyzer-reddit",
+    "auto_find_batch_size": false,
+    "mixed_precision": null,
+    "save_total_limit": 1,
+    "save_strategy": "epoch",
+    "push_to_hub": true,
+    "repo_id": "beenakurian/autotrain-sentiment-analyzer-reddit",
+    "evaluation_strategy": "epoch",
+    "username": "beenakurian",
+    "log": "none"
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff