rvv-karma commited on Dec 10, 2023

Commit

743363a

•

1 Parent(s): b018198

End of training

Browse files

Files changed (19) hide show

README.md +82 -0
all_results.json +13 -0
config.json +58 -0
eval_results.json +8 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
runs/Dec10_11-10-30_1ca383c7b033/events.out.tfevents.1702206785.1ca383c7b033.7463.0 +3 -0
runs/Dec10_11-10-30_1ca383c7b033/events.out.tfevents.1702207216.1ca383c7b033.7463.1 +3 -0
runs/Dec10_11-31-28_1ca383c7b033/events.out.tfevents.1702207892.1ca383c7b033.7463.2 +3 -0
runs/Dec10_11-32-31_1ca383c7b033/events.out.tfevents.1702207955.1ca383c7b033.13158.0 +3 -0
runs/Dec10_11-36-26_1ca383c7b033/events.out.tfevents.1702208191.1ca383c7b033.14225.0 +3 -0
runs/Dec10_11-36-26_1ca383c7b033/events.out.tfevents.1702209262.1ca383c7b033.14225.1 +3 -0
runs/Dec10_11-59-18_1ca383c7b033/events.out.tfevents.1702209564.1ca383c7b033.20107.0 +3 -0
runs/Dec10_12-02-18_1ca383c7b033/events.out.tfevents.1702209743.1ca383c7b033.20945.0 +3 -0
runs/Dec10_12-30-16_1ca383c7b033/events.out.tfevents.1702211423.1ca383c7b033.28198.0 +3 -0
runs/Dec10_12-30-16_1ca383c7b033/events.out.tfevents.1702218768.1ca383c7b033.28198.1 +3 -0
train_results.json +8 -0
trainer_state.json +328 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,82 @@

+---
+license: apache-2.0
+base_model: google/vit-base-patch16-224
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+model-index:
+- name: Human-Action-Recognition-VIT-Base-patch16-224
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# Human-Action-Recognition-VIT-Base-patch16-224
+This model is a fine-tuned version of [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.4005
+- Accuracy: 0.8786
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 64
+- eval_batch_size: 64
+- seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 256
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 20
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 2.6396        | 0.99  | 39   | 2.0436          | 0.4425   |
+| 1.4579        | 2.0   | 79   | 0.7553          | 0.7917   |
+| 0.8342        | 2.99  | 118  | 0.5296          | 0.8417   |
+| 0.6649        | 4.0   | 158  | 0.4978          | 0.8496   |
+| 0.6137        | 4.99  | 197  | 0.4460          | 0.8595   |
+| 0.5374        | 6.0   | 237  | 0.4356          | 0.8627   |
+| 0.514         | 6.99  | 276  | 0.4349          | 0.8615   |
+| 0.475         | 8.0   | 316  | 0.4005          | 0.8786   |
+| 0.4663        | 8.99  | 355  | 0.4164          | 0.8659   |
+| 0.4178        | 10.0  | 395  | 0.4128          | 0.8738   |
+| 0.4226        | 10.99 | 434  | 0.4115          | 0.8690   |
+| 0.3896        | 12.0  | 474  | 0.4112          | 0.875    |
+| 0.3866        | 12.99 | 513  | 0.4072          | 0.8714   |
+| 0.3632        | 14.0  | 553  | 0.4106          | 0.8718   |
+| 0.3596        | 14.99 | 592  | 0.4043          | 0.8714   |
+| 0.3421        | 16.0  | 632  | 0.4128          | 0.8675   |
+| 0.344         | 16.99 | 671  | 0.4181          | 0.8643   |
+| 0.3447        | 18.0  | 711  | 0.4128          | 0.8687   |
+| 0.3407        | 18.99 | 750  | 0.4097          | 0.8714   |
+| 0.3267        | 19.75 | 780  | 0.4097          | 0.8683   |
+### Framework versions
+- Transformers 4.35.2
+- Pytorch 2.1.0+cu118
+- Datasets 2.15.0
+- Tokenizers 0.15.0

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 19.75,
+    "eval_accuracy": 0.8785714285714286,
+    "eval_loss": 0.4005189836025238,
+    "eval_runtime": 34.3244,
+    "eval_samples_per_second": 73.417,
+    "eval_steps_per_second": 1.165,
+    "total_flos": 1.5428282771770638e+19,
+    "train_loss": 0.6146706715608254,
+    "train_runtime": 7303.7952,
+    "train_samples_per_second": 27.602,
+    "train_steps_per_second": 0.107
+}

config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "calling",
+    "1": "clapping",
+    "2": "cycling",
+    "3": "dancing",
+    "4": "drinking",
+    "5": "eating",
+    "6": "fighting",
+    "7": "hugging",
+    "8": "laughing",
+    "9": "listening_to_music",
+    "10": "running",
+    "11": "sitting",
+    "12": "sleeping",
+    "13": "texting",
+    "14": "using_laptop"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "calling": 0,
+    "clapping": 1,
+    "cycling": 2,
+    "dancing": 3,
+    "drinking": 4,
+    "eating": 5,
+    "fighting": 6,
+    "hugging": 7,
+    "laughing": 8,
+    "listening_to_music": 9,
+    "running": 10,
+    "sitting": 11,
+    "sleeping": 12,
+    "texting": 13,
+    "using_laptop": 14
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2"
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 19.75,
+    "eval_accuracy": 0.8785714285714286,
+    "eval_loss": 0.4005189836025238,
+    "eval_runtime": 34.3244,
+    "eval_samples_per_second": 73.417,
+    "eval_steps_per_second": 1.165
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7056e0051ac930aa8db19a1c3135cdc6a181837d660814e9c3fd8ad6123ea815
+size 343263964

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

runs/Dec10_11-10-30_1ca383c7b033/events.out.tfevents.1702206785.1ca383c7b033.7463.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:196d434e6cb09a98387967754ead38a75f49815eda61a418681519c74762620d
+size 16046

runs/Dec10_11-10-30_1ca383c7b033/events.out.tfevents.1702207216.1ca383c7b033.7463.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8e334e4f002a51a44b8eae916cceb98bd541da9e26d6cf89f344744b81ec094d
+size 405

runs/Dec10_11-31-28_1ca383c7b033/events.out.tfevents.1702207892.1ca383c7b033.7463.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6aad26a6a20cbfc81cf893c55434c625d2fabef40860b9d5f268d0cc8a87af95
+size 4184

runs/Dec10_11-32-31_1ca383c7b033/events.out.tfevents.1702207955.1ca383c7b033.13158.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:058f73f004a2c8d0e7af1fb0e674b58f733575d5b2baf78e3a461ac096a28a46
+size 5470

runs/Dec10_11-36-26_1ca383c7b033/events.out.tfevents.1702208191.1ca383c7b033.14225.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0c1a35f0b7f118c30a88561acd99bff9cc5a4357bfa0e4f5b85a255b3ba0f9bd
+size 6142

runs/Dec10_11-36-26_1ca383c7b033/events.out.tfevents.1702209262.1ca383c7b033.14225.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a1ef4f5fd284ce82d0dbda4c17518b8b1eb45ece5d3a5c4304c70d3dadb9cc57
+size 405

runs/Dec10_11-59-18_1ca383c7b033/events.out.tfevents.1702209564.1ca383c7b033.20107.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f48a7a0166952ee446efb3bbacf32b2a5d1b0de000849031781ceb7be86e8d11
+size 4853

runs/Dec10_12-02-18_1ca383c7b033/events.out.tfevents.1702209743.1ca383c7b033.20945.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d15d8cf48e8f197ce36b39e8d7a76203f5efd9604bc975efe4d251042156a2e6
+size 6275

runs/Dec10_12-30-16_1ca383c7b033/events.out.tfevents.1702211423.1ca383c7b033.28198.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e6384388584a921d5466a895e87f964249d4ad46810e03040bfa89bc83b52b6
+size 14780

runs/Dec10_12-30-16_1ca383c7b033/events.out.tfevents.1702218768.1ca383c7b033.28198.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8ee745d15d25fd95d595f6e5f30fe6ca9c5ea39f7adb0baf861fb7c7eeff34fd
+size 411

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 19.75,
+    "total_flos": 1.5428282771770638e+19,
+    "train_loss": 0.6146706715608254,
+    "train_runtime": 7303.7952,
+    "train_samples_per_second": 27.602,
+    "train_steps_per_second": 0.107
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,328 @@

+{
+  "best_metric": 0.8785714285714286,
+  "best_model_checkpoint": "Human-Action-Recognition-VIT-Base-patch16-224/checkpoint-316",
+  "epoch": 19.746835443037973,
+  "eval_steps": 500,
+  "global_step": 780,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.99,
+      "learning_rate": 2.5e-05,
+      "loss": 2.6396,
+      "step": 39
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.44246031746031744,
+      "eval_loss": 2.04364275932312,
+      "eval_runtime": 33.6234,
+      "eval_samples_per_second": 74.948,
+      "eval_steps_per_second": 1.19,
+      "step": 39
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 4.992877492877493e-05,
+      "loss": 1.4579,
+      "step": 79
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.7916666666666666,
+      "eval_loss": 0.7552899122238159,
+      "eval_runtime": 33.9732,
+      "eval_samples_per_second": 74.176,
+      "eval_steps_per_second": 1.177,
+      "step": 79
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 4.7150997150997157e-05,
+      "loss": 0.8342,
+      "step": 118
+    },
+    {
+      "epoch": 2.99,
+      "eval_accuracy": 0.8416666666666667,
+      "eval_loss": 0.5296158194541931,
+      "eval_runtime": 33.8808,
+      "eval_samples_per_second": 74.378,
+      "eval_steps_per_second": 1.181,
+      "step": 118
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 4.4301994301994304e-05,
+      "loss": 0.6649,
+      "step": 158
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.8496031746031746,
+      "eval_loss": 0.4977969229221344,
+      "eval_runtime": 33.6309,
+      "eval_samples_per_second": 74.931,
+      "eval_steps_per_second": 1.189,
+      "step": 158
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 4.152421652421652e-05,
+      "loss": 0.6137,
+      "step": 197
+    },
+    {
+      "epoch": 4.99,
+      "eval_accuracy": 0.8595238095238096,
+      "eval_loss": 0.44600579142570496,
+      "eval_runtime": 33.559,
+      "eval_samples_per_second": 75.092,
+      "eval_steps_per_second": 1.192,
+      "step": 197
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 3.867521367521368e-05,
+      "loss": 0.5374,
+      "step": 237
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8626984126984127,
+      "eval_loss": 0.43557941913604736,
+      "eval_runtime": 33.4656,
+      "eval_samples_per_second": 75.301,
+      "eval_steps_per_second": 1.195,
+      "step": 237
+    },
+    {
+      "epoch": 6.99,
+      "learning_rate": 3.58974358974359e-05,
+      "loss": 0.514,
+      "step": 276
+    },
+    {
+      "epoch": 6.99,
+      "eval_accuracy": 0.8615079365079366,
+      "eval_loss": 0.4348864257335663,
+      "eval_runtime": 33.7031,
+      "eval_samples_per_second": 74.771,
+      "eval_steps_per_second": 1.187,
+      "step": 276
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 3.304843304843305e-05,
+      "loss": 0.475,
+      "step": 316
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8785714285714286,
+      "eval_loss": 0.4005189836025238,
+      "eval_runtime": 33.4656,
+      "eval_samples_per_second": 75.301,
+      "eval_steps_per_second": 1.195,
+      "step": 316
+    },
+    {
+      "epoch": 8.99,
+      "learning_rate": 3.0270655270655275e-05,
+      "loss": 0.4663,
+      "step": 355
+    },
+    {
+      "epoch": 8.99,
+      "eval_accuracy": 0.8658730158730159,
+      "eval_loss": 0.4163670241832733,
+      "eval_runtime": 33.7779,
+      "eval_samples_per_second": 74.605,
+      "eval_steps_per_second": 1.184,
+      "step": 355
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 2.7421652421652423e-05,
+      "loss": 0.4178,
+      "step": 395
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.8738095238095238,
+      "eval_loss": 0.4127999544143677,
+      "eval_runtime": 33.3961,
+      "eval_samples_per_second": 75.458,
+      "eval_steps_per_second": 1.198,
+      "step": 395
+    },
+    {
+      "epoch": 10.99,
+      "learning_rate": 2.4643874643874645e-05,
+      "loss": 0.4226,
+      "step": 434
+    },
+    {
+      "epoch": 10.99,
+      "eval_accuracy": 0.8690476190476191,
+      "eval_loss": 0.4115118980407715,
+      "eval_runtime": 33.5412,
+      "eval_samples_per_second": 75.131,
+      "eval_steps_per_second": 1.193,
+      "step": 434
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 2.1794871794871795e-05,
+      "loss": 0.3896,
+      "step": 474
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.875,
+      "eval_loss": 0.4112005829811096,
+      "eval_runtime": 33.6831,
+      "eval_samples_per_second": 74.815,
+      "eval_steps_per_second": 1.188,
+      "step": 474
+    },
+    {
+      "epoch": 12.99,
+      "learning_rate": 1.9017094017094017e-05,
+      "loss": 0.3866,
+      "step": 513
+    },
+    {
+      "epoch": 12.99,
+      "eval_accuracy": 0.8714285714285714,
+      "eval_loss": 0.4072014093399048,
+      "eval_runtime": 33.7064,
+      "eval_samples_per_second": 74.763,
+      "eval_steps_per_second": 1.187,
+      "step": 513
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 1.6168091168091168e-05,
+      "loss": 0.3632,
+      "step": 553
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.8718253968253968,
+      "eval_loss": 0.41061681509017944,
+      "eval_runtime": 33.9136,
+      "eval_samples_per_second": 74.306,
+      "eval_steps_per_second": 1.179,
+      "step": 553
+    },
+    {
+      "epoch": 14.99,
+      "learning_rate": 1.3390313390313392e-05,
+      "loss": 0.3596,
+      "step": 592
+    },
+    {
+      "epoch": 14.99,
+      "eval_accuracy": 0.8714285714285714,
+      "eval_loss": 0.4042780101299286,
+      "eval_runtime": 33.971,
+      "eval_samples_per_second": 74.181,
+      "eval_steps_per_second": 1.177,
+      "step": 592
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 1.0541310541310543e-05,
+      "loss": 0.3421,
+      "step": 632
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.8674603174603175,
+      "eval_loss": 0.4128040075302124,
+      "eval_runtime": 33.5678,
+      "eval_samples_per_second": 75.072,
+      "eval_steps_per_second": 1.192,
+      "step": 632
+    },
+    {
+      "epoch": 16.99,
+      "learning_rate": 7.763532763532765e-06,
+      "loss": 0.344,
+      "step": 671
+    },
+    {
+      "epoch": 16.99,
+      "eval_accuracy": 0.8642857142857143,
+      "eval_loss": 0.41805535554885864,
+      "eval_runtime": 33.6623,
+      "eval_samples_per_second": 74.861,
+      "eval_steps_per_second": 1.188,
+      "step": 671
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 4.914529914529915e-06,
+      "loss": 0.3447,
+      "step": 711
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.8686507936507937,
+      "eval_loss": 0.41281768679618835,
+      "eval_runtime": 33.9679,
+      "eval_samples_per_second": 74.188,
+      "eval_steps_per_second": 1.178,
+      "step": 711
+    },
+    {
+      "epoch": 18.99,
+      "learning_rate": 2.136752136752137e-06,
+      "loss": 0.3407,
+      "step": 750
+    },
+    {
+      "epoch": 18.99,
+      "eval_accuracy": 0.8714285714285714,
+      "eval_loss": 0.40965768694877625,
+      "eval_runtime": 33.6119,
+      "eval_samples_per_second": 74.973,
+      "eval_steps_per_second": 1.19,
+      "step": 750
+    },
+    {
+      "epoch": 19.75,
+      "learning_rate": 0.0,
+      "loss": 0.3267,
+      "step": 780
+    },
+    {
+      "epoch": 19.75,
+      "eval_accuracy": 0.8682539682539683,
+      "eval_loss": 0.40967872738838196,
+      "eval_runtime": 34.1352,
+      "eval_samples_per_second": 73.824,
+      "eval_steps_per_second": 1.172,
+      "step": 780
+    },
+    {
+      "epoch": 19.75,
+      "step": 780,
+      "total_flos": 1.5428282771770638e+19,
+      "train_loss": 0.6146706715608254,
+      "train_runtime": 7303.7952,
+      "train_samples_per_second": 27.602,
+      "train_steps_per_second": 0.107
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 780,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "total_flos": 1.5428282771770638e+19,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7d26bb9e3a70b2c8352b321913a1989c2ebf70972127858a70a2e4b75644fe29
+size 4600