End of training

Browse files

Files changed (6) hide show

README.md +3 -3
all_results.json +12 -0
eval_results.json +8 -0
runs/May23_07-59-52_DESKTOP-SKBE9FB/events.out.tfevents.1716475133.DESKTOP-SKBE9FB.17360.1 +3 -0
train_results.json +7 -0
trainer_state.json +870 -0

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.8166666666666667
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.8929
-- Accuracy: 0.8167
 ## Model description

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.8666666666666667
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5495
+- Accuracy: 0.8667
 ## Model description

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 40.0,
+    "eval_accuracy": 0.8666666666666667,
+    "eval_loss": 0.5495395660400391,
+    "eval_runtime": 1.1232,
+    "eval_samples_per_second": 53.418,
+    "eval_steps_per_second": 1.781,
+    "train_loss": 0.1800640467181802,
+    "train_runtime": 1621.1538,
+    "train_samples_per_second": 62.671,
+    "train_steps_per_second": 0.493
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 40.0,
+    "eval_accuracy": 0.8666666666666667,
+    "eval_loss": 0.5495395660400391,
+    "eval_runtime": 1.1232,
+    "eval_samples_per_second": 53.418,
+    "eval_steps_per_second": 1.781
+}

runs/May23_07-59-52_DESKTOP-SKBE9FB/events.out.tfevents.1716475133.DESKTOP-SKBE9FB.17360.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3ed67502d7fe64b141bb80b4dfaaa161266ee7c3bbec3a56cf18342ce6c69c82
+size 411

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 40.0,
+    "train_loss": 0.1800640467181802,
+    "train_runtime": 1621.1538,
+    "train_samples_per_second": 62.671,
+    "train_steps_per_second": 0.493
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,870 @@

+{
+  "best_metric": 0.8666666666666667,
+  "best_model_checkpoint": "vit-base-patch16-224-U8-40\\checkpoint-100",
+  "epoch": 40.0,
+  "eval_steps": 500,
+  "global_step": 800,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.5,
+      "learning_rate": 1.375e-05,
+      "loss": 1.3823,
+      "step": 10
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 2.75e-05,
+      "loss": 1.3457,
+      "step": 20
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.45,
+      "eval_loss": 1.312751054763794,
+      "eval_runtime": 1.0907,
+      "eval_samples_per_second": 55.012,
+      "eval_steps_per_second": 1.834,
+      "step": 20
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 4.125e-05,
+      "loss": 1.2727,
+      "step": 30
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 5.5e-05,
+      "loss": 1.1498,
+      "step": 40
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.5666666666666667,
+      "eval_loss": 1.10469388961792,
+      "eval_runtime": 1.0087,
+      "eval_samples_per_second": 59.483,
+      "eval_steps_per_second": 1.983,
+      "step": 40
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 5.4276315789473686e-05,
+      "loss": 1.0035,
+      "step": 50
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 5.355263157894737e-05,
+      "loss": 0.8312,
+      "step": 60
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.65,
+      "eval_loss": 0.8231016397476196,
+      "eval_runtime": 0.959,
+      "eval_samples_per_second": 62.565,
+      "eval_steps_per_second": 2.086,
+      "step": 60
+    },
+    {
+      "epoch": 3.5,
+      "learning_rate": 5.282894736842105e-05,
+      "loss": 0.6784,
+      "step": 70
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 5.210526315789474e-05,
+      "loss": 0.5334,
+      "step": 80
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.5718551278114319,
+      "eval_runtime": 0.9624,
+      "eval_samples_per_second": 62.346,
+      "eval_steps_per_second": 2.078,
+      "step": 80
+    },
+    {
+      "epoch": 4.5,
+      "learning_rate": 5.138157894736842e-05,
+      "loss": 0.4291,
+      "step": 90
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 5.0657894736842104e-05,
+      "loss": 0.3582,
+      "step": 100
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.8666666666666667,
+      "eval_loss": 0.5495395660400391,
+      "eval_runtime": 0.9691,
+      "eval_samples_per_second": 61.916,
+      "eval_steps_per_second": 2.064,
+      "step": 100
+    },
+    {
+      "epoch": 5.5,
+      "learning_rate": 4.9934210526315795e-05,
+      "loss": 0.3013,
+      "step": 110
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 4.921052631578948e-05,
+      "loss": 0.2389,
+      "step": 120
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.5800701975822449,
+      "eval_runtime": 0.9832,
+      "eval_samples_per_second": 61.028,
+      "eval_steps_per_second": 2.034,
+      "step": 120
+    },
+    {
+      "epoch": 6.5,
+      "learning_rate": 4.8486842105263156e-05,
+      "loss": 0.2008,
+      "step": 130
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 4.7763157894736846e-05,
+      "loss": 0.2055,
+      "step": 140
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.6727150678634644,
+      "eval_runtime": 0.9731,
+      "eval_samples_per_second": 61.656,
+      "eval_steps_per_second": 2.055,
+      "step": 140
+    },
+    {
+      "epoch": 7.5,
+      "learning_rate": 4.703947368421053e-05,
+      "loss": 0.2019,
+      "step": 150
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 4.631578947368421e-05,
+      "loss": 0.1738,
+      "step": 160
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.7237645983695984,
+      "eval_runtime": 0.9886,
+      "eval_samples_per_second": 60.69,
+      "eval_steps_per_second": 2.023,
+      "step": 160
+    },
+    {
+      "epoch": 8.5,
+      "learning_rate": 4.55921052631579e-05,
+      "loss": 0.1508,
+      "step": 170
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 4.486842105263158e-05,
+      "loss": 0.1556,
+      "step": 180
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.75,
+      "eval_loss": 0.7665268778800964,
+      "eval_runtime": 0.9669,
+      "eval_samples_per_second": 62.054,
+      "eval_steps_per_second": 2.068,
+      "step": 180
+    },
+    {
+      "epoch": 9.5,
+      "learning_rate": 4.4144736842105265e-05,
+      "loss": 0.1414,
+      "step": 190
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 4.342105263157895e-05,
+      "loss": 0.1461,
+      "step": 200
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.7666666666666667,
+      "eval_loss": 0.822857677936554,
+      "eval_runtime": 1.0828,
+      "eval_samples_per_second": 55.411,
+      "eval_steps_per_second": 1.847,
+      "step": 200
+    },
+    {
+      "epoch": 10.5,
+      "learning_rate": 4.269736842105263e-05,
+      "loss": 0.1309,
+      "step": 210
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 4.197368421052632e-05,
+      "loss": 0.1401,
+      "step": 220
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.75,
+      "eval_loss": 0.8102101683616638,
+      "eval_runtime": 0.9793,
+      "eval_samples_per_second": 61.265,
+      "eval_steps_per_second": 2.042,
+      "step": 220
+    },
+    {
+      "epoch": 11.5,
+      "learning_rate": 4.125e-05,
+      "loss": 0.1161,
+      "step": 230
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 4.0526315789473684e-05,
+      "loss": 0.08,
+      "step": 240
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.6608515977859497,
+      "eval_runtime": 1.0247,
+      "eval_samples_per_second": 58.555,
+      "eval_steps_per_second": 1.952,
+      "step": 240
+    },
+    {
+      "epoch": 12.5,
+      "learning_rate": 3.9802631578947374e-05,
+      "loss": 0.1089,
+      "step": 250
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 3.907894736842105e-05,
+      "loss": 0.0989,
+      "step": 260
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.6703253388404846,
+      "eval_runtime": 1.0441,
+      "eval_samples_per_second": 57.465,
+      "eval_steps_per_second": 1.915,
+      "step": 260
+    },
+    {
+      "epoch": 13.5,
+      "learning_rate": 3.8355263157894735e-05,
+      "loss": 0.1044,
+      "step": 270
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 3.7631578947368425e-05,
+      "loss": 0.0773,
+      "step": 280
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.7303264141082764,
+      "eval_runtime": 1.0099,
+      "eval_samples_per_second": 59.412,
+      "eval_steps_per_second": 1.98,
+      "step": 280
+    },
+    {
+      "epoch": 14.5,
+      "learning_rate": 3.69078947368421e-05,
+      "loss": 0.0816,
+      "step": 290
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 3.618421052631579e-05,
+      "loss": 0.089,
+      "step": 300
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.7833333333333333,
+      "eval_loss": 0.7757053971290588,
+      "eval_runtime": 1.0238,
+      "eval_samples_per_second": 58.605,
+      "eval_steps_per_second": 1.953,
+      "step": 300
+    },
+    {
+      "epoch": 15.5,
+      "learning_rate": 3.5460526315789476e-05,
+      "loss": 0.0591,
+      "step": 310
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 3.473684210526316e-05,
+      "loss": 0.11,
+      "step": 320
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.7278648614883423,
+      "eval_runtime": 1.0068,
+      "eval_samples_per_second": 59.595,
+      "eval_steps_per_second": 1.987,
+      "step": 320
+    },
+    {
+      "epoch": 16.5,
+      "learning_rate": 3.4013157894736844e-05,
+      "loss": 0.0749,
+      "step": 330
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 3.328947368421053e-05,
+      "loss": 0.086,
+      "step": 340
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.7833333333333333,
+      "eval_loss": 0.849124014377594,
+      "eval_runtime": 0.9755,
+      "eval_samples_per_second": 61.509,
+      "eval_steps_per_second": 2.05,
+      "step": 340
+    },
+    {
+      "epoch": 17.5,
+      "learning_rate": 3.256578947368421e-05,
+      "loss": 0.0875,
+      "step": 350
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 3.1842105263157895e-05,
+      "loss": 0.0671,
+      "step": 360
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.7949829697608948,
+      "eval_runtime": 1.0555,
+      "eval_samples_per_second": 56.847,
+      "eval_steps_per_second": 1.895,
+      "step": 360
+    },
+    {
+      "epoch": 18.5,
+      "learning_rate": 3.111842105263158e-05,
+      "loss": 0.0828,
+      "step": 370
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 3.0394736842105266e-05,
+      "loss": 0.0775,
+      "step": 380
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.85,
+      "eval_loss": 0.6752822995185852,
+      "eval_runtime": 1.0074,
+      "eval_samples_per_second": 59.558,
+      "eval_steps_per_second": 1.985,
+      "step": 380
+    },
+    {
+      "epoch": 19.5,
+      "learning_rate": 2.967105263157895e-05,
+      "loss": 0.0816,
+      "step": 390
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 2.894736842105263e-05,
+      "loss": 0.0636,
+      "step": 400
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.7880961298942566,
+      "eval_runtime": 1.036,
+      "eval_samples_per_second": 57.915,
+      "eval_steps_per_second": 1.93,
+      "step": 400
+    },
+    {
+      "epoch": 20.5,
+      "learning_rate": 2.822368421052632e-05,
+      "loss": 0.0592,
+      "step": 410
+    },
+    {
+      "epoch": 21.0,
+      "learning_rate": 2.75e-05,
+      "loss": 0.0737,
+      "step": 420
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.7449613809585571,
+      "eval_runtime": 0.996,
+      "eval_samples_per_second": 60.243,
+      "eval_steps_per_second": 2.008,
+      "step": 420
+    },
+    {
+      "epoch": 21.5,
+      "learning_rate": 2.6776315789473685e-05,
+      "loss": 0.0616,
+      "step": 430
+    },
+    {
+      "epoch": 22.0,
+      "learning_rate": 2.605263157894737e-05,
+      "loss": 0.0583,
+      "step": 440
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.8295071125030518,
+      "eval_runtime": 0.9869,
+      "eval_samples_per_second": 60.794,
+      "eval_steps_per_second": 2.026,
+      "step": 440
+    },
+    {
+      "epoch": 22.5,
+      "learning_rate": 2.5328947368421052e-05,
+      "loss": 0.0546,
+      "step": 450
+    },
+    {
+      "epoch": 23.0,
+      "learning_rate": 2.460526315789474e-05,
+      "loss": 0.0646,
+      "step": 460
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.8226525187492371,
+      "eval_runtime": 1.0606,
+      "eval_samples_per_second": 56.57,
+      "eval_steps_per_second": 1.886,
+      "step": 460
+    },
+    {
+      "epoch": 23.5,
+      "learning_rate": 2.3881578947368423e-05,
+      "loss": 0.0703,
+      "step": 470
+    },
+    {
+      "epoch": 24.0,
+      "learning_rate": 2.3157894736842103e-05,
+      "loss": 0.0637,
+      "step": 480
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.7833333333333333,
+      "eval_loss": 0.9029874205589294,
+      "eval_runtime": 0.9829,
+      "eval_samples_per_second": 61.045,
+      "eval_steps_per_second": 2.035,
+      "step": 480
+    },
+    {
+      "epoch": 24.5,
+      "learning_rate": 2.243421052631579e-05,
+      "loss": 0.0375,
+      "step": 490
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 2.1710526315789474e-05,
+      "loss": 0.0647,
+      "step": 500
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.8656226992607117,
+      "eval_runtime": 1.0209,
+      "eval_samples_per_second": 58.772,
+      "eval_steps_per_second": 1.959,
+      "step": 500
+    },
+    {
+      "epoch": 25.5,
+      "learning_rate": 2.098684210526316e-05,
+      "loss": 0.0578,
+      "step": 510
+    },
+    {
+      "epoch": 26.0,
+      "learning_rate": 2.0263157894736842e-05,
+      "loss": 0.0477,
+      "step": 520
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.836243748664856,
+      "eval_runtime": 1.0029,
+      "eval_samples_per_second": 59.824,
+      "eval_steps_per_second": 1.994,
+      "step": 520
+    },
+    {
+      "epoch": 26.5,
+      "learning_rate": 1.9539473684210525e-05,
+      "loss": 0.0532,
+      "step": 530
+    },
+    {
+      "epoch": 27.0,
+      "learning_rate": 1.8815789473684213e-05,
+      "loss": 0.0481,
+      "step": 540
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.8388897180557251,
+      "eval_runtime": 1.0189,
+      "eval_samples_per_second": 58.885,
+      "eval_steps_per_second": 1.963,
+      "step": 540
+    },
+    {
+      "epoch": 27.5,
+      "learning_rate": 1.8092105263157896e-05,
+      "loss": 0.0426,
+      "step": 550
+    },
+    {
+      "epoch": 28.0,
+      "learning_rate": 1.736842105263158e-05,
+      "loss": 0.0355,
+      "step": 560
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.9424023032188416,
+      "eval_runtime": 1.0258,
+      "eval_samples_per_second": 58.493,
+      "eval_steps_per_second": 1.95,
+      "step": 560
+    },
+    {
+      "epoch": 28.5,
+      "learning_rate": 1.6644736842105264e-05,
+      "loss": 0.0298,
+      "step": 570
+    },
+    {
+      "epoch": 29.0,
+      "learning_rate": 1.5921052631578948e-05,
+      "loss": 0.0352,
+      "step": 580
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.8,
+      "eval_loss": 0.8962697386741638,
+      "eval_runtime": 1.0413,
+      "eval_samples_per_second": 57.622,
+      "eval_steps_per_second": 1.921,
+      "step": 580
+    },
+    {
+      "epoch": 29.5,
+      "learning_rate": 1.5197368421052633e-05,
+      "loss": 0.0516,
+      "step": 590
+    },
+    {
+      "epoch": 30.0,
+      "learning_rate": 1.4473684210526315e-05,
+      "loss": 0.0335,
+      "step": 600
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.8559876680374146,
+      "eval_runtime": 1.042,
+      "eval_samples_per_second": 57.582,
+      "eval_steps_per_second": 1.919,
+      "step": 600
+    },
+    {
+      "epoch": 30.5,
+      "learning_rate": 1.375e-05,
+      "loss": 0.0535,
+      "step": 610
+    },
+    {
+      "epoch": 31.0,
+      "learning_rate": 1.3026315789473684e-05,
+      "loss": 0.0372,
+      "step": 620
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.7249892950057983,
+      "eval_runtime": 1.024,
+      "eval_samples_per_second": 58.596,
+      "eval_steps_per_second": 1.953,
+      "step": 620
+    },
+    {
+      "epoch": 31.5,
+      "learning_rate": 1.230263157894737e-05,
+      "loss": 0.037,
+      "step": 630
+    },
+    {
+      "epoch": 32.0,
+      "learning_rate": 1.1578947368421052e-05,
+      "loss": 0.0389,
+      "step": 640
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.7846233248710632,
+      "eval_runtime": 1.0305,
+      "eval_samples_per_second": 58.227,
+      "eval_steps_per_second": 1.941,
+      "step": 640
+    },
+    {
+      "epoch": 32.5,
+      "learning_rate": 1.0855263157894737e-05,
+      "loss": 0.0281,
+      "step": 650
+    },
+    {
+      "epoch": 33.0,
+      "learning_rate": 1.0131578947368421e-05,
+      "loss": 0.0425,
+      "step": 660
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.8532330989837646,
+      "eval_runtime": 1.0292,
+      "eval_samples_per_second": 58.296,
+      "eval_steps_per_second": 1.943,
+      "step": 660
+    },
+    {
+      "epoch": 33.5,
+      "learning_rate": 9.407894736842106e-06,
+      "loss": 0.0398,
+      "step": 670
+    },
+    {
+      "epoch": 34.0,
+      "learning_rate": 8.68421052631579e-06,
+      "loss": 0.0404,
+      "step": 680
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.8333333333333334,
+      "eval_loss": 0.8169179558753967,
+      "eval_runtime": 0.9963,
+      "eval_samples_per_second": 60.225,
+      "eval_steps_per_second": 2.007,
+      "step": 680
+    },
+    {
+      "epoch": 34.5,
+      "learning_rate": 7.960526315789474e-06,
+      "loss": 0.0282,
+      "step": 690
+    },
+    {
+      "epoch": 35.0,
+      "learning_rate": 7.2368421052631575e-06,
+      "loss": 0.0359,
+      "step": 700
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.868202269077301,
+      "eval_runtime": 1.0467,
+      "eval_samples_per_second": 57.325,
+      "eval_steps_per_second": 1.911,
+      "step": 700
+    },
+    {
+      "epoch": 35.5,
+      "learning_rate": 6.513157894736842e-06,
+      "loss": 0.0464,
+      "step": 710
+    },
+    {
+      "epoch": 36.0,
+      "learning_rate": 5.789473684210526e-06,
+      "loss": 0.0231,
+      "step": 720
+    },
+    {
+      "epoch": 36.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.9361733198165894,
+      "eval_runtime": 1.0146,
+      "eval_samples_per_second": 59.135,
+      "eval_steps_per_second": 1.971,
+      "step": 720
+    },
+    {
+      "epoch": 36.5,
+      "learning_rate": 5.0657894736842104e-06,
+      "loss": 0.0272,
+      "step": 730
+    },
+    {
+      "epoch": 37.0,
+      "learning_rate": 4.342105263157895e-06,
+      "loss": 0.027,
+      "step": 740
+    },
+    {
+      "epoch": 37.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.9138814210891724,
+      "eval_runtime": 1.0004,
+      "eval_samples_per_second": 59.974,
+      "eval_steps_per_second": 1.999,
+      "step": 740
+    },
+    {
+      "epoch": 37.5,
+      "learning_rate": 3.6184210526315788e-06,
+      "loss": 0.0253,
+      "step": 750
+    },
+    {
+      "epoch": 38.0,
+      "learning_rate": 2.894736842105263e-06,
+      "loss": 0.0214,
+      "step": 760
+    },
+    {
+      "epoch": 38.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.8781832456588745,
+      "eval_runtime": 1.0219,
+      "eval_samples_per_second": 58.714,
+      "eval_steps_per_second": 1.957,
+      "step": 760
+    },
+    {
+      "epoch": 38.5,
+      "learning_rate": 2.1710526315789475e-06,
+      "loss": 0.0279,
+      "step": 770
+    },
+    {
+      "epoch": 39.0,
+      "learning_rate": 1.4473684210526315e-06,
+      "loss": 0.0191,
+      "step": 780
+    },
+    {
+      "epoch": 39.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.8794050812721252,
+      "eval_runtime": 1.0338,
+      "eval_samples_per_second": 58.037,
+      "eval_steps_per_second": 1.935,
+      "step": 780
+    },
+    {
+      "epoch": 39.5,
+      "learning_rate": 7.236842105263157e-07,
+      "loss": 0.0161,
+      "step": 790
+    },
+    {
+      "epoch": 40.0,
+      "learning_rate": 0.0,
+      "loss": 0.0293,
+      "step": 800
+    },
+    {
+      "epoch": 40.0,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_loss": 0.8929299712181091,
+      "eval_runtime": 1.0258,
+      "eval_samples_per_second": 58.493,
+      "eval_steps_per_second": 1.95,
+      "step": 800
+    },
+    {
+      "epoch": 40.0,
+      "step": 800,
+      "total_flos": 7.873327274596762e+18,
+      "train_loss": 0.1800640467181802,
+      "train_runtime": 1621.1538,
+      "train_samples_per_second": 62.671,
+      "train_steps_per_second": 0.493
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 800,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 40,
+  "save_steps": 500,
+  "total_flos": 7.873327274596762e+18,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}