File size: 3,177 Bytes

81c5c9c
df2302d
 
b8aaf94
df2302d
81c5c9c
 
 
 
 
df2302d
 
 
81c5c9c
 
 
df2302d
 
 
81c5c9c
 
 
df2302d
 
 
81c5c9c
 
 
df2302d
 
 
81c5c9c
 
 
df2302d
 
 
81c5c9c
 
3c045f1
df2302d
 
 
3c045f1
 
 
df2302d
 
 
3c045f1
 
 
df2302d
 
 
3c045f1
 
 
df2302d
 
 
3c045f1
 
 
df2302d
 
 
3c045f1
 
 
df2302d
 
 
 
 
 
3c045f1
 
81c5c9c
df2302d
 
 
b8aaf94
 
 
df2302d
 
 
b8aaf94
 
 
df2302d
 
 
b8aaf94
 
 
df2302d
 
 
b8aaf94
 
 
df2302d
 
 
b8aaf94
 
 
df2302d
 
 
b8aaf94
 
 
df2302d
 
 
b8aaf94
 
 
df2302d
 
 
b8aaf94
 
 
df2302d
 
 
b8aaf94
 
0184747
 
df2302d
 
 
0184747
 
 
df2302d
 
 
 
 
 
0184747
b8aaf94
 
df2302d
 
 
 
 
 
81c5c9c
 
df2302d
b8aaf94
df2302d
81c5c9c

{
  "best_metric": 2.153944969177246,
  "best_model_checkpoint": "./vit-base/checkpoint-200",
  "epoch": 20.0,
  "global_step": 200,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 1.0,
      "learning_rate": 0.00019,
      "loss": 0.0007,
      "step": 10
    },
    {
      "epoch": 2.0,
      "learning_rate": 0.00018,
      "loss": 0.1073,
      "step": 20
    },
    {
      "epoch": 3.0,
      "learning_rate": 0.00017,
      "loss": 0.205,
      "step": 30
    },
    {
      "epoch": 4.0,
      "learning_rate": 0.00016,
      "loss": 0.0034,
      "step": 40
    },
    {
      "epoch": 5.0,
      "learning_rate": 0.00015000000000000001,
      "loss": 0.0011,
      "step": 50
    },
    {
      "epoch": 6.0,
      "learning_rate": 0.00014,
      "loss": 0.001,
      "step": 60
    },
    {
      "epoch": 7.0,
      "learning_rate": 0.00013000000000000002,
      "loss": 0.0003,
      "step": 70
    },
    {
      "epoch": 8.0,
      "learning_rate": 0.00012,
      "loss": 0.0,
      "step": 80
    },
    {
      "epoch": 9.0,
      "learning_rate": 0.00011000000000000002,
      "loss": 0.0,
      "step": 90
    },
    {
      "epoch": 10.0,
      "learning_rate": 0.0001,
      "loss": 0.0,
      "step": 100
    },
    {
      "epoch": 10.0,
      "eval_accuracy": 0.625,
      "eval_loss": 2.155715227127075,
      "eval_runtime": 0.2927,
      "eval_samples_per_second": 54.664,
      "eval_steps_per_second": 6.833,
      "step": 100
    },
    {
      "epoch": 11.0,
      "learning_rate": 9e-05,
      "loss": 0.0,
      "step": 110
    },
    {
      "epoch": 12.0,
      "learning_rate": 8e-05,
      "loss": 0.0,
      "step": 120
    },
    {
      "epoch": 13.0,
      "learning_rate": 7e-05,
      "loss": 0.0,
      "step": 130
    },
    {
      "epoch": 14.0,
      "learning_rate": 6e-05,
      "loss": 0.0,
      "step": 140
    },
    {
      "epoch": 15.0,
      "learning_rate": 5e-05,
      "loss": 0.0,
      "step": 150
    },
    {
      "epoch": 16.0,
      "learning_rate": 4e-05,
      "loss": 0.0,
      "step": 160
    },
    {
      "epoch": 17.0,
      "learning_rate": 3e-05,
      "loss": 0.0,
      "step": 170
    },
    {
      "epoch": 18.0,
      "learning_rate": 2e-05,
      "loss": 0.0,
      "step": 180
    },
    {
      "epoch": 19.0,
      "learning_rate": 1e-05,
      "loss": 0.0,
      "step": 190
    },
    {
      "epoch": 20.0,
      "learning_rate": 0.0,
      "loss": 0.0,
      "step": 200
    },
    {
      "epoch": 20.0,
      "eval_accuracy": 0.625,
      "eval_loss": 2.153944969177246,
      "eval_runtime": 0.2762,
      "eval_samples_per_second": 57.924,
      "eval_steps_per_second": 7.241,
      "step": 200
    },
    {
      "epoch": 20.0,
      "step": 200,
      "total_flos": 6.19947029495808e+16,
      "train_loss": 0.015958890169858932,
      "train_runtime": 31.8203,
      "train_samples_per_second": 25.141,
      "train_steps_per_second": 6.285
    }
  ],
  "max_steps": 200,
  "num_train_epochs": 20,
  "total_flos": 6.19947029495808e+16,
  "trial_name": null,
  "trial_params": null
}