heyitsjearbear commited on May 5, 2024

Commit

d3c42a7

•

1 Parent(s): 91e4067

Upload folder using huggingface_hub

Browse files

Files changed (23) hide show

all_results.json +8 -0
checkpoint-120/config.json +32 -0
checkpoint-120/model.safetensors +3 -0
checkpoint-120/optimizer.pt +3 -0
checkpoint-120/preprocessor_config.json +36 -0
checkpoint-120/rng_state.pth +3 -0
checkpoint-120/scheduler.pt +3 -0
checkpoint-120/trainer_state.json +132 -0
checkpoint-120/training_args.bin +3 -0
checkpoint-160/config.json +32 -0
checkpoint-160/model.safetensors +3 -0
checkpoint-160/optimizer.pt +3 -0
checkpoint-160/preprocessor_config.json +36 -0
checkpoint-160/rng_state.pth +3 -0
checkpoint-160/scheduler.pt +3 -0
checkpoint-160/trainer_state.json +169 -0
checkpoint-160/training_args.bin +3 -0
config.json +32 -0
model.safetensors +3 -0
preprocessor_config.json +36 -0
train_results.json +8 -0
trainer_state.json +178 -0
training_args.bin +3 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 32.0,
+    "total_flos": 1.8350103140735386e+17,
+    "train_loss": 0.03308067205362022,
+    "train_runtime": 121.1399,
+    "train_samples_per_second": 19.548,
+    "train_steps_per_second": 1.321
+}

checkpoint-120/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "mold",
+    "1": "non-mold"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "mold": "0",
+    "non-mold": "1"
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.40.1"
+}

checkpoint-120/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8957d0a669550e5402b43df5e7727b6ddc09e4784fe83eec8b0c3afe5486bda1
+size 343223968

checkpoint-120/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:64723caebe47a46d2229b0824556e27b48cb37973a53fc3462e1861f5a4973fe
+size 686568890

checkpoint-120/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_valid_processor_keys": [
+    "images",
+    "do_resize",
+    "size",
+    "resample",
+    "do_rescale",
+    "rescale_factor",
+    "do_normalize",
+    "image_mean",
+    "image_std",
+    "return_tensors",
+    "data_format",
+    "input_data_format"
+  ],
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

checkpoint-120/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b3bd3cafcd141485c5526689e7070ba65dab1e4639fbae44141ae41439003c1f
+size 14244

checkpoint-120/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8e330a80cd73509e4d36a2e26bc84533f25e1b9420ada1a46870d473f74e7d8
+size 1064

checkpoint-120/trainer_state.json ADDED Viewed

	@@ -0,0 +1,132 @@

+{
+  "best_metric": 0.018665345385670662,
+  "best_model_checkpoint": "./vit-strawberries/checkpoint-120",
+  "epoch": 24.0,
+  "eval_steps": 40,
+  "global_step": 120,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 2.0,
+      "grad_norm": 0.6030758023262024,
+      "learning_rate": 0.0001875,
+      "loss": 0.3813,
+      "step": 10
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 0.19357694685459137,
+      "learning_rate": 0.000175,
+      "loss": 0.0627,
+      "step": 20
+    },
+    {
+      "epoch": 6.0,
+      "grad_norm": 0.09823369234800339,
+      "learning_rate": 0.00016250000000000002,
+      "loss": 0.0166,
+      "step": 30
+    },
+    {
+      "epoch": 8.0,
+      "grad_norm": 0.06956500560045242,
+      "learning_rate": 0.00015000000000000001,
+      "loss": 0.0102,
+      "step": 40
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.021412454545497894,
+      "eval_runtime": 0.4006,
+      "eval_samples_per_second": 64.901,
+      "eval_steps_per_second": 9.985,
+      "step": 40
+    },
+    {
+      "epoch": 10.0,
+      "grad_norm": 0.059710320085287094,
+      "learning_rate": 0.0001375,
+      "loss": 0.0078,
+      "step": 50
+    },
+    {
+      "epoch": 12.0,
+      "grad_norm": 0.04971468821167946,
+      "learning_rate": 0.000125,
+      "loss": 0.0065,
+      "step": 60
+    },
+    {
+      "epoch": 14.0,
+      "grad_norm": 0.044971030205488205,
+      "learning_rate": 0.00011250000000000001,
+      "loss": 0.0058,
+      "step": 70
+    },
+    {
+      "epoch": 16.0,
+      "grad_norm": 0.04283370077610016,
+      "learning_rate": 0.0001,
+      "loss": 0.0052,
+      "step": 80
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.019078843295574188,
+      "eval_runtime": 0.4188,
+      "eval_samples_per_second": 62.087,
+      "eval_steps_per_second": 9.552,
+      "step": 80
+    },
+    {
+      "epoch": 18.0,
+      "grad_norm": 0.03907443583011627,
+      "learning_rate": 8.75e-05,
+      "loss": 0.0048,
+      "step": 90
+    },
+    {
+      "epoch": 20.0,
+      "grad_norm": 0.03701604902744293,
+      "learning_rate": 7.500000000000001e-05,
+      "loss": 0.0045,
+      "step": 100
+    },
+    {
+      "epoch": 22.0,
+      "grad_norm": 0.03528870269656181,
+      "learning_rate": 6.25e-05,
+      "loss": 0.0043,
+      "step": 110
+    },
+    {
+      "epoch": 24.0,
+      "grad_norm": 0.033964332193136215,
+      "learning_rate": 5e-05,
+      "loss": 0.0041,
+      "step": 120
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.018665345385670662,
+      "eval_runtime": 0.4061,
+      "eval_samples_per_second": 64.02,
+      "eval_steps_per_second": 9.849,
+      "step": 120
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 160,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 32,
+  "save_steps": 40,
+  "total_flos": 1.376257735555154e+17,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-120/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:deb496ae4ef9baef4da454a5aeb81107fc1c8c5186e0e0e4558b603478a5db94
+size 4984

checkpoint-160/config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "mold",
+    "1": "non-mold"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "mold": "0",
+    "non-mold": "1"
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.40.1"
+}

checkpoint-160/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f2dec449c03a6a4a335f6706b8121a11f67349c62f865dc61bebeab88fcc1f9d
+size 343223968

checkpoint-160/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9c5058d92612251a9c59fb5caa74cdf04a9cf374e124467191f87f6175c4207b
+size 686568890

checkpoint-160/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_valid_processor_keys": [
+    "images",
+    "do_resize",
+    "size",
+    "resample",
+    "do_rescale",
+    "rescale_factor",
+    "do_normalize",
+    "image_mean",
+    "image_std",
+    "return_tensors",
+    "data_format",
+    "input_data_format"
+  ],
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

checkpoint-160/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f86f749dc73bc16a2502fef2f98f5c00b4400cb2c67fbe62653b7ed104d13779
+size 14244

checkpoint-160/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ec82b88d9fc1851330cce56bddf8838806450e0dcb4ecdc26493c05dc810338d
+size 1064

checkpoint-160/trainer_state.json ADDED Viewed

	@@ -0,0 +1,169 @@

+{
+  "best_metric": 0.018665345385670662,
+  "best_model_checkpoint": "./vit-strawberries/checkpoint-120",
+  "epoch": 32.0,
+  "eval_steps": 40,
+  "global_step": 160,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 2.0,
+      "grad_norm": 0.6030758023262024,
+      "learning_rate": 0.0001875,
+      "loss": 0.3813,
+      "step": 10
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 0.19357694685459137,
+      "learning_rate": 0.000175,
+      "loss": 0.0627,
+      "step": 20
+    },
+    {
+      "epoch": 6.0,
+      "grad_norm": 0.09823369234800339,
+      "learning_rate": 0.00016250000000000002,
+      "loss": 0.0166,
+      "step": 30
+    },
+    {
+      "epoch": 8.0,
+      "grad_norm": 0.06956500560045242,
+      "learning_rate": 0.00015000000000000001,
+      "loss": 0.0102,
+      "step": 40
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.021412454545497894,
+      "eval_runtime": 0.4006,
+      "eval_samples_per_second": 64.901,
+      "eval_steps_per_second": 9.985,
+      "step": 40
+    },
+    {
+      "epoch": 10.0,
+      "grad_norm": 0.059710320085287094,
+      "learning_rate": 0.0001375,
+      "loss": 0.0078,
+      "step": 50
+    },
+    {
+      "epoch": 12.0,
+      "grad_norm": 0.04971468821167946,
+      "learning_rate": 0.000125,
+      "loss": 0.0065,
+      "step": 60
+    },
+    {
+      "epoch": 14.0,
+      "grad_norm": 0.044971030205488205,
+      "learning_rate": 0.00011250000000000001,
+      "loss": 0.0058,
+      "step": 70
+    },
+    {
+      "epoch": 16.0,
+      "grad_norm": 0.04283370077610016,
+      "learning_rate": 0.0001,
+      "loss": 0.0052,
+      "step": 80
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.019078843295574188,
+      "eval_runtime": 0.4188,
+      "eval_samples_per_second": 62.087,
+      "eval_steps_per_second": 9.552,
+      "step": 80
+    },
+    {
+      "epoch": 18.0,
+      "grad_norm": 0.03907443583011627,
+      "learning_rate": 8.75e-05,
+      "loss": 0.0048,
+      "step": 90
+    },
+    {
+      "epoch": 20.0,
+      "grad_norm": 0.03701604902744293,
+      "learning_rate": 7.500000000000001e-05,
+      "loss": 0.0045,
+      "step": 100
+    },
+    {
+      "epoch": 22.0,
+      "grad_norm": 0.03528870269656181,
+      "learning_rate": 6.25e-05,
+      "loss": 0.0043,
+      "step": 110
+    },
+    {
+      "epoch": 24.0,
+      "grad_norm": 0.033964332193136215,
+      "learning_rate": 5e-05,
+      "loss": 0.0041,
+      "step": 120
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.018665345385670662,
+      "eval_runtime": 0.4061,
+      "eval_samples_per_second": 64.02,
+      "eval_steps_per_second": 9.849,
+      "step": 120
+    },
+    {
+      "epoch": 26.0,
+      "grad_norm": 0.03315058350563049,
+      "learning_rate": 3.7500000000000003e-05,
+      "loss": 0.004,
+      "step": 130
+    },
+    {
+      "epoch": 28.0,
+      "grad_norm": 0.031990278512239456,
+      "learning_rate": 2.5e-05,
+      "loss": 0.0039,
+      "step": 140
+    },
+    {
+      "epoch": 30.0,
+      "grad_norm": 0.031738851219415665,
+      "learning_rate": 1.25e-05,
+      "loss": 0.0038,
+      "step": 150
+    },
+    {
+      "epoch": 32.0,
+      "grad_norm": 0.03203798457980156,
+      "learning_rate": 0.0,
+      "loss": 0.0038,
+      "step": 160
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.01877218298614025,
+      "eval_runtime": 0.485,
+      "eval_samples_per_second": 53.611,
+      "eval_steps_per_second": 8.248,
+      "step": 160
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 160,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 32,
+  "save_steps": 40,
+  "total_flos": 1.8350103140735386e+17,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-160/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:deb496ae4ef9baef4da454a5aeb81107fc1c8c5186e0e0e4558b603478a5db94
+size 4984

config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "mold",
+    "1": "non-mold"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "mold": "0",
+    "non-mold": "1"
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.40.1"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8957d0a669550e5402b43df5e7727b6ddc09e4784fe83eec8b0c3afe5486bda1
+size 343223968

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_valid_processor_keys": [
+    "images",
+    "do_resize",
+    "size",
+    "resample",
+    "do_rescale",
+    "rescale_factor",
+    "do_normalize",
+    "image_mean",
+    "image_std",
+    "return_tensors",
+    "data_format",
+    "input_data_format"
+  ],
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 32.0,
+    "total_flos": 1.8350103140735386e+17,
+    "train_loss": 0.03308067205362022,
+    "train_runtime": 121.1399,
+    "train_samples_per_second": 19.548,
+    "train_steps_per_second": 1.321
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,178 @@

+{
+  "best_metric": 0.018665345385670662,
+  "best_model_checkpoint": "./vit-strawberries/checkpoint-120",
+  "epoch": 32.0,
+  "eval_steps": 40,
+  "global_step": 160,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 2.0,
+      "grad_norm": 0.6030758023262024,
+      "learning_rate": 0.0001875,
+      "loss": 0.3813,
+      "step": 10
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 0.19357694685459137,
+      "learning_rate": 0.000175,
+      "loss": 0.0627,
+      "step": 20
+    },
+    {
+      "epoch": 6.0,
+      "grad_norm": 0.09823369234800339,
+      "learning_rate": 0.00016250000000000002,
+      "loss": 0.0166,
+      "step": 30
+    },
+    {
+      "epoch": 8.0,
+      "grad_norm": 0.06956500560045242,
+      "learning_rate": 0.00015000000000000001,
+      "loss": 0.0102,
+      "step": 40
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.021412454545497894,
+      "eval_runtime": 0.4006,
+      "eval_samples_per_second": 64.901,
+      "eval_steps_per_second": 9.985,
+      "step": 40
+    },
+    {
+      "epoch": 10.0,
+      "grad_norm": 0.059710320085287094,
+      "learning_rate": 0.0001375,
+      "loss": 0.0078,
+      "step": 50
+    },
+    {
+      "epoch": 12.0,
+      "grad_norm": 0.04971468821167946,
+      "learning_rate": 0.000125,
+      "loss": 0.0065,
+      "step": 60
+    },
+    {
+      "epoch": 14.0,
+      "grad_norm": 0.044971030205488205,
+      "learning_rate": 0.00011250000000000001,
+      "loss": 0.0058,
+      "step": 70
+    },
+    {
+      "epoch": 16.0,
+      "grad_norm": 0.04283370077610016,
+      "learning_rate": 0.0001,
+      "loss": 0.0052,
+      "step": 80
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.019078843295574188,
+      "eval_runtime": 0.4188,
+      "eval_samples_per_second": 62.087,
+      "eval_steps_per_second": 9.552,
+      "step": 80
+    },
+    {
+      "epoch": 18.0,
+      "grad_norm": 0.03907443583011627,
+      "learning_rate": 8.75e-05,
+      "loss": 0.0048,
+      "step": 90
+    },
+    {
+      "epoch": 20.0,
+      "grad_norm": 0.03701604902744293,
+      "learning_rate": 7.500000000000001e-05,
+      "loss": 0.0045,
+      "step": 100
+    },
+    {
+      "epoch": 22.0,
+      "grad_norm": 0.03528870269656181,
+      "learning_rate": 6.25e-05,
+      "loss": 0.0043,
+      "step": 110
+    },
+    {
+      "epoch": 24.0,
+      "grad_norm": 0.033964332193136215,
+      "learning_rate": 5e-05,
+      "loss": 0.0041,
+      "step": 120
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.018665345385670662,
+      "eval_runtime": 0.4061,
+      "eval_samples_per_second": 64.02,
+      "eval_steps_per_second": 9.849,
+      "step": 120
+    },
+    {
+      "epoch": 26.0,
+      "grad_norm": 0.03315058350563049,
+      "learning_rate": 3.7500000000000003e-05,
+      "loss": 0.004,
+      "step": 130
+    },
+    {
+      "epoch": 28.0,
+      "grad_norm": 0.031990278512239456,
+      "learning_rate": 2.5e-05,
+      "loss": 0.0039,
+      "step": 140
+    },
+    {
+      "epoch": 30.0,
+      "grad_norm": 0.031738851219415665,
+      "learning_rate": 1.25e-05,
+      "loss": 0.0038,
+      "step": 150
+    },
+    {
+      "epoch": 32.0,
+      "grad_norm": 0.03203798457980156,
+      "learning_rate": 0.0,
+      "loss": 0.0038,
+      "step": 160
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.01877218298614025,
+      "eval_runtime": 0.485,
+      "eval_samples_per_second": 53.611,
+      "eval_steps_per_second": 8.248,
+      "step": 160
+    },
+    {
+      "epoch": 32.0,
+      "step": 160,
+      "total_flos": 1.8350103140735386e+17,
+      "train_loss": 0.03308067205362022,
+      "train_runtime": 121.1399,
+      "train_samples_per_second": 19.548,
+      "train_steps_per_second": 1.321
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 160,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 32,
+  "save_steps": 40,
+  "total_flos": 1.8350103140735386e+17,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:deb496ae4ef9baef4da454a5aeb81107fc1c8c5186e0e0e4558b603478a5db94
+size 4984