Upload folder using huggingface_hub

by WizardLord160 - opened Mar 24

base: refs/heads/main

←

from: refs/pr/1

Discussion Files changed

+252

-0

Files changed (8) hide show

config.json +32 -0
model.safetensors +3 -0
optimizer.pt +3 -0
preprocessor_config.json +36 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
trainer_state.json +169 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Organic",
+    "1": "Recyclable"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Organic": "0",
+    "Recyclable": "1"
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.1"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2e6e41c4cd036bc236a5a372503759dc979b88f5cd5ef350010e4c011484e73b
+size 343223968

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c2f57dfe3f874535aa4f7af1f1c358515a3a2db0f7ca5b7d0ab15304e8b7b09b
+size 686568890

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_valid_processor_keys": [
+    "images",
+    "do_resize",
+    "size",
+    "resample",
+    "do_rescale",
+    "rescale_factor",
+    "do_normalize",
+    "image_mean",
+    "image_std",
+    "return_tensors",
+    "data_format",
+    "input_data_format"
+  ],
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:36eb3c91b3077080e254ba8fd9a96b4afe9cf22aec04441fdc41ff8bc2a91d56
+size 14244

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:747261821b81a19e4a5e02b2c215740a08800cde4b342a1671d75e217f38bf5c
+size 1064

trainer_state.json ADDED Viewed

	@@ -0,0 +1,169 @@

+{
+  "best_metric": 0.05549783632159233,
+  "best_model_checkpoint": "./vit-base-beans/checkpoint-160",
+  "epoch": 3.6363636363636362,
+  "eval_steps": 40,
+  "global_step": 160,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.23,
+      "grad_norm": 0.8493722081184387,
+      "learning_rate": 0.00018863636363636364,
+      "loss": 0.444,
+      "step": 10
+    },
+    {
+      "epoch": 0.45,
+      "grad_norm": 0.272053599357605,
+      "learning_rate": 0.00017727272727272728,
+      "loss": 0.151,
+      "step": 20
+    },
+    {
+      "epoch": 0.68,
+      "grad_norm": 0.1838751882314682,
+      "learning_rate": 0.00016590909090909094,
+      "loss": 0.117,
+      "step": 30
+    },
+    {
+      "epoch": 0.91,
+      "grad_norm": 4.570974349975586,
+      "learning_rate": 0.00015454545454545454,
+      "loss": 0.2073,
+      "step": 40
+    },
+    {
+      "epoch": 0.91,
+      "eval_accuracy": 0.975,
+      "eval_loss": 0.09584420919418335,
+      "eval_runtime": 57.723,
+      "eval_samples_per_second": 3.465,
+      "eval_steps_per_second": 0.433,
+      "step": 40
+    },
+    {
+      "epoch": 1.14,
+      "grad_norm": 0.50724858045578,
+      "learning_rate": 0.0001431818181818182,
+      "loss": 0.0636,
+      "step": 50
+    },
+    {
+      "epoch": 1.36,
+      "grad_norm": 0.09627090394496918,
+      "learning_rate": 0.0001318181818181818,
+      "loss": 0.0651,
+      "step": 60
+    },
+    {
+      "epoch": 1.59,
+      "grad_norm": 0.08125822246074677,
+      "learning_rate": 0.00012045454545454546,
+      "loss": 0.0298,
+      "step": 70
+    },
+    {
+      "epoch": 1.82,
+      "grad_norm": 0.0715242475271225,
+      "learning_rate": 0.00010909090909090909,
+      "loss": 0.0342,
+      "step": 80
+    },
+    {
+      "epoch": 1.82,
+      "eval_accuracy": 0.965,
+      "eval_loss": 0.09033375978469849,
+      "eval_runtime": 3.0566,
+      "eval_samples_per_second": 65.433,
+      "eval_steps_per_second": 8.179,
+      "step": 80
+    },
+    {
+      "epoch": 2.05,
+      "grad_norm": 0.06209810450673103,
+      "learning_rate": 9.772727272727274e-05,
+      "loss": 0.0213,
+      "step": 90
+    },
+    {
+      "epoch": 2.27,
+      "grad_norm": 0.056180860847234726,
+      "learning_rate": 8.636363636363637e-05,
+      "loss": 0.0081,
+      "step": 100
+    },
+    {
+      "epoch": 2.5,
+      "grad_norm": 0.05113891884684563,
+      "learning_rate": 7.500000000000001e-05,
+      "loss": 0.0073,
+      "step": 110
+    },
+    {
+      "epoch": 2.73,
+      "grad_norm": 0.05209748074412346,
+      "learning_rate": 6.363636363636364e-05,
+      "loss": 0.0139,
+      "step": 120
+    },
+    {
+      "epoch": 2.73,
+      "eval_accuracy": 0.965,
+      "eval_loss": 0.09859169274568558,
+      "eval_runtime": 2.9938,
+      "eval_samples_per_second": 66.805,
+      "eval_steps_per_second": 8.351,
+      "step": 120
+    },
+    {
+      "epoch": 2.95,
+      "grad_norm": 0.06674375385046005,
+      "learning_rate": 5.2272727272727274e-05,
+      "loss": 0.0068,
+      "step": 130
+    },
+    {
+      "epoch": 3.18,
+      "grad_norm": 0.04334596171975136,
+      "learning_rate": 4.0909090909090915e-05,
+      "loss": 0.0068,
+      "step": 140
+    },
+    {
+      "epoch": 3.41,
+      "grad_norm": 0.04224753752350807,
+      "learning_rate": 2.954545454545455e-05,
+      "loss": 0.0057,
+      "step": 150
+    },
+    {
+      "epoch": 3.64,
+      "grad_norm": 0.048290498554706573,
+      "learning_rate": 1.8181818181818182e-05,
+      "loss": 0.0069,
+      "step": 160
+    },
+    {
+      "epoch": 3.64,
+      "eval_accuracy": 0.97,
+      "eval_loss": 0.05549783632159233,
+      "eval_runtime": 3.0091,
+      "eval_samples_per_second": 66.466,
+      "eval_steps_per_second": 8.308,
+      "step": 160
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 176,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
+  "save_steps": 40,
+  "total_flos": 1.9721711356913664e+17,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:833ab1718730deabe9af742d455d7c30a8647e53cc425a57ec14b4026143f9d4
+size 4920