ihanif commited on
Commit
b124ad3
1 Parent(s): a30593b

End of training

Browse files
all_results.json CHANGED
@@ -1,15 +1,15 @@
1
  {
2
- "epoch": 63.29,
3
  "eval_cer": 0.1969102547256584,
4
  "eval_loss": 0.9162458181381226,
5
- "eval_runtime": 44.5084,
6
  "eval_samples": 481,
7
- "eval_samples_per_second": 10.807,
8
- "eval_steps_per_second": 1.371,
9
  "eval_wer": 0.5156036834924966,
10
- "train_loss": 0.05515483856201172,
11
- "train_runtime": 2237.6776,
12
  "train_samples": 2528,
13
- "train_samples_per_second": 71.503,
14
- "train_steps_per_second": 2.234
15
  }
 
1
  {
2
+ "epoch": 69.62,
3
  "eval_cer": 0.1969102547256584,
4
  "eval_loss": 0.9162458181381226,
5
+ "eval_runtime": 45.2212,
6
  "eval_samples": 481,
7
+ "eval_samples_per_second": 10.637,
8
+ "eval_steps_per_second": 1.349,
9
  "eval_wer": 0.5156036834924966,
10
+ "train_loss": 0.04894279766082764,
11
+ "train_runtime": 2118.6173,
12
  "train_samples": 2528,
13
+ "train_samples_per_second": 83.073,
14
+ "train_steps_per_second": 2.596
15
  }
eval_results.json CHANGED
@@ -1,10 +1,10 @@
1
  {
2
- "epoch": 63.29,
3
  "eval_cer": 0.1969102547256584,
4
  "eval_loss": 0.9162458181381226,
5
- "eval_runtime": 44.5084,
6
  "eval_samples": 481,
7
- "eval_samples_per_second": 10.807,
8
- "eval_steps_per_second": 1.371,
9
  "eval_wer": 0.5156036834924966
10
  }
 
1
  {
2
+ "epoch": 69.62,
3
  "eval_cer": 0.1969102547256584,
4
  "eval_loss": 0.9162458181381226,
5
+ "eval_runtime": 45.2212,
6
  "eval_samples": 481,
7
+ "eval_samples_per_second": 10.637,
8
+ "eval_steps_per_second": 1.349,
9
  "eval_wer": 0.5156036834924966
10
  }
runs/Dec16_20-12-50_129-146-104-29/events.out.tfevents.1671223965.129-146-104-29.144289.2 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:80e8f010a29167816de5acc6dfa4ebc9166999dc4d6436f409cabb8252b3b9dc
3
+ size 405
train_results.json CHANGED
@@ -1,8 +1,8 @@
1
  {
2
- "epoch": 63.29,
3
- "train_loss": 0.05515483856201172,
4
- "train_runtime": 2237.6776,
5
  "train_samples": 2528,
6
- "train_samples_per_second": 71.503,
7
- "train_steps_per_second": 2.234
8
  }
 
1
  {
2
+ "epoch": 69.62,
3
+ "train_loss": 0.04894279766082764,
4
+ "train_runtime": 2118.6173,
5
  "train_samples": 2528,
6
+ "train_samples_per_second": 83.073,
7
+ "train_steps_per_second": 2.596
8
  }
trainer_state.json CHANGED
@@ -1,8 +1,8 @@
1
  {
2
  "best_metric": 0.9162458181381226,
3
  "best_model_checkpoint": "./checkpoint-4000",
4
- "epoch": 63.29113924050633,
5
- "global_step": 5000,
6
  "is_hyper_param_search": false,
7
  "is_local_process_zero": true,
8
  "is_world_process_zero": true,
@@ -3108,18 +3108,328 @@
3108
  "step": 5000
3109
  },
3110
  {
3111
- "epoch": 63.29,
3112
- "step": 5000,
3113
- "total_flos": 5.7547597013827174e+19,
3114
- "train_loss": 0.05515483856201172,
3115
- "train_runtime": 2237.6776,
3116
- "train_samples_per_second": 71.503,
3117
- "train_steps_per_second": 2.234
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3118
  }
3119
  ],
3120
- "max_steps": 5000,
3121
- "num_train_epochs": 64,
3122
- "total_flos": 5.7547597013827174e+19,
3123
  "trial_name": null,
3124
  "trial_params": null
3125
  }
 
1
  {
2
  "best_metric": 0.9162458181381226,
3
  "best_model_checkpoint": "./checkpoint-4000",
4
+ "epoch": 69.62025316455696,
5
+ "global_step": 5500,
6
  "is_hyper_param_search": false,
7
  "is_local_process_zero": true,
8
  "is_world_process_zero": true,
 
3108
  "step": 5000
3109
  },
3110
  {
3111
+ "epoch": 63.42,
3112
+ "learning_rate": 8.2e-06,
3113
+ "loss": 0.5146,
3114
+ "step": 5010
3115
+ },
3116
+ {
3117
+ "epoch": 63.54,
3118
+ "learning_rate": 8.033333333333333e-06,
3119
+ "loss": 0.5334,
3120
+ "step": 5020
3121
+ },
3122
+ {
3123
+ "epoch": 63.67,
3124
+ "learning_rate": 7.866666666666667e-06,
3125
+ "loss": 0.5824,
3126
+ "step": 5030
3127
+ },
3128
+ {
3129
+ "epoch": 63.8,
3130
+ "learning_rate": 7.699999999999999e-06,
3131
+ "loss": 0.5354,
3132
+ "step": 5040
3133
+ },
3134
+ {
3135
+ "epoch": 63.92,
3136
+ "learning_rate": 7.533333333333333e-06,
3137
+ "loss": 0.5225,
3138
+ "step": 5050
3139
+ },
3140
+ {
3141
+ "epoch": 64.05,
3142
+ "learning_rate": 7.366666666666666e-06,
3143
+ "loss": 0.5296,
3144
+ "step": 5060
3145
+ },
3146
+ {
3147
+ "epoch": 64.18,
3148
+ "learning_rate": 7.2e-06,
3149
+ "loss": 0.525,
3150
+ "step": 5070
3151
+ },
3152
+ {
3153
+ "epoch": 64.3,
3154
+ "learning_rate": 7.033333333333333e-06,
3155
+ "loss": 0.5549,
3156
+ "step": 5080
3157
+ },
3158
+ {
3159
+ "epoch": 64.43,
3160
+ "learning_rate": 6.8666666666666664e-06,
3161
+ "loss": 0.5579,
3162
+ "step": 5090
3163
+ },
3164
+ {
3165
+ "epoch": 64.56,
3166
+ "learning_rate": 6.699999999999999e-06,
3167
+ "loss": 0.5527,
3168
+ "step": 5100
3169
+ },
3170
+ {
3171
+ "epoch": 64.68,
3172
+ "learning_rate": 6.533333333333333e-06,
3173
+ "loss": 0.5191,
3174
+ "step": 5110
3175
+ },
3176
+ {
3177
+ "epoch": 64.81,
3178
+ "learning_rate": 6.366666666666666e-06,
3179
+ "loss": 0.5591,
3180
+ "step": 5120
3181
+ },
3182
+ {
3183
+ "epoch": 64.94,
3184
+ "learning_rate": 6.199999999999999e-06,
3185
+ "loss": 0.5371,
3186
+ "step": 5130
3187
+ },
3188
+ {
3189
+ "epoch": 65.06,
3190
+ "learning_rate": 6.033333333333333e-06,
3191
+ "loss": 0.5527,
3192
+ "step": 5140
3193
+ },
3194
+ {
3195
+ "epoch": 65.19,
3196
+ "learning_rate": 5.866666666666666e-06,
3197
+ "loss": 0.5318,
3198
+ "step": 5150
3199
+ },
3200
+ {
3201
+ "epoch": 65.32,
3202
+ "learning_rate": 5.7e-06,
3203
+ "loss": 0.5684,
3204
+ "step": 5160
3205
+ },
3206
+ {
3207
+ "epoch": 65.44,
3208
+ "learning_rate": 5.533333333333333e-06,
3209
+ "loss": 0.528,
3210
+ "step": 5170
3211
+ },
3212
+ {
3213
+ "epoch": 65.57,
3214
+ "learning_rate": 5.366666666666666e-06,
3215
+ "loss": 0.5366,
3216
+ "step": 5180
3217
+ },
3218
+ {
3219
+ "epoch": 65.7,
3220
+ "learning_rate": 5.199999999999999e-06,
3221
+ "loss": 0.5482,
3222
+ "step": 5190
3223
+ },
3224
+ {
3225
+ "epoch": 65.82,
3226
+ "learning_rate": 5.033333333333332e-06,
3227
+ "loss": 0.5402,
3228
+ "step": 5200
3229
+ },
3230
+ {
3231
+ "epoch": 65.95,
3232
+ "learning_rate": 4.866666666666666e-06,
3233
+ "loss": 0.5568,
3234
+ "step": 5210
3235
+ },
3236
+ {
3237
+ "epoch": 66.08,
3238
+ "learning_rate": 4.699999999999999e-06,
3239
+ "loss": 0.5466,
3240
+ "step": 5220
3241
+ },
3242
+ {
3243
+ "epoch": 66.2,
3244
+ "learning_rate": 4.533333333333333e-06,
3245
+ "loss": 0.5353,
3246
+ "step": 5230
3247
+ },
3248
+ {
3249
+ "epoch": 66.33,
3250
+ "learning_rate": 4.366666666666667e-06,
3251
+ "loss": 0.5629,
3252
+ "step": 5240
3253
+ },
3254
+ {
3255
+ "epoch": 66.46,
3256
+ "learning_rate": 4.2e-06,
3257
+ "loss": 0.5227,
3258
+ "step": 5250
3259
+ },
3260
+ {
3261
+ "epoch": 66.58,
3262
+ "learning_rate": 4.033333333333333e-06,
3263
+ "loss": 0.5126,
3264
+ "step": 5260
3265
+ },
3266
+ {
3267
+ "epoch": 66.71,
3268
+ "learning_rate": 3.866666666666666e-06,
3269
+ "loss": 0.5173,
3270
+ "step": 5270
3271
+ },
3272
+ {
3273
+ "epoch": 66.84,
3274
+ "learning_rate": 3.6999999999999997e-06,
3275
+ "loss": 0.5773,
3276
+ "step": 5280
3277
+ },
3278
+ {
3279
+ "epoch": 66.96,
3280
+ "learning_rate": 3.533333333333333e-06,
3281
+ "loss": 0.5131,
3282
+ "step": 5290
3283
+ },
3284
+ {
3285
+ "epoch": 67.09,
3286
+ "learning_rate": 3.3666666666666665e-06,
3287
+ "loss": 0.5592,
3288
+ "step": 5300
3289
+ },
3290
+ {
3291
+ "epoch": 67.22,
3292
+ "learning_rate": 3.1999999999999994e-06,
3293
+ "loss": 0.5164,
3294
+ "step": 5310
3295
+ },
3296
+ {
3297
+ "epoch": 67.34,
3298
+ "learning_rate": 3.033333333333333e-06,
3299
+ "loss": 0.5166,
3300
+ "step": 5320
3301
+ },
3302
+ {
3303
+ "epoch": 67.47,
3304
+ "learning_rate": 2.866666666666666e-06,
3305
+ "loss": 0.5079,
3306
+ "step": 5330
3307
+ },
3308
+ {
3309
+ "epoch": 67.59,
3310
+ "learning_rate": 2.6999999999999996e-06,
3311
+ "loss": 0.547,
3312
+ "step": 5340
3313
+ },
3314
+ {
3315
+ "epoch": 67.72,
3316
+ "learning_rate": 2.533333333333333e-06,
3317
+ "loss": 0.5188,
3318
+ "step": 5350
3319
+ },
3320
+ {
3321
+ "epoch": 67.85,
3322
+ "learning_rate": 2.3666666666666667e-06,
3323
+ "loss": 0.5779,
3324
+ "step": 5360
3325
+ },
3326
+ {
3327
+ "epoch": 67.97,
3328
+ "learning_rate": 2.1999999999999997e-06,
3329
+ "loss": 0.5424,
3330
+ "step": 5370
3331
+ },
3332
+ {
3333
+ "epoch": 68.1,
3334
+ "learning_rate": 2.033333333333333e-06,
3335
+ "loss": 0.5307,
3336
+ "step": 5380
3337
+ },
3338
+ {
3339
+ "epoch": 68.23,
3340
+ "learning_rate": 1.8666666666666664e-06,
3341
+ "loss": 0.5353,
3342
+ "step": 5390
3343
+ },
3344
+ {
3345
+ "epoch": 68.35,
3346
+ "learning_rate": 1.7e-06,
3347
+ "loss": 0.5521,
3348
+ "step": 5400
3349
+ },
3350
+ {
3351
+ "epoch": 68.48,
3352
+ "learning_rate": 1.5333333333333332e-06,
3353
+ "loss": 0.5024,
3354
+ "step": 5410
3355
+ },
3356
+ {
3357
+ "epoch": 68.61,
3358
+ "learning_rate": 1.3666666666666666e-06,
3359
+ "loss": 0.5765,
3360
+ "step": 5420
3361
+ },
3362
+ {
3363
+ "epoch": 68.73,
3364
+ "learning_rate": 1.2e-06,
3365
+ "loss": 0.497,
3366
+ "step": 5430
3367
+ },
3368
+ {
3369
+ "epoch": 68.86,
3370
+ "learning_rate": 1.0333333333333333e-06,
3371
+ "loss": 0.5822,
3372
+ "step": 5440
3373
+ },
3374
+ {
3375
+ "epoch": 68.99,
3376
+ "learning_rate": 8.666666666666666e-07,
3377
+ "loss": 0.5189,
3378
+ "step": 5450
3379
+ },
3380
+ {
3381
+ "epoch": 69.11,
3382
+ "learning_rate": 7e-07,
3383
+ "loss": 0.5356,
3384
+ "step": 5460
3385
+ },
3386
+ {
3387
+ "epoch": 69.24,
3388
+ "learning_rate": 5.333333333333333e-07,
3389
+ "loss": 0.5289,
3390
+ "step": 5470
3391
+ },
3392
+ {
3393
+ "epoch": 69.37,
3394
+ "learning_rate": 3.666666666666666e-07,
3395
+ "loss": 0.5522,
3396
+ "step": 5480
3397
+ },
3398
+ {
3399
+ "epoch": 69.49,
3400
+ "learning_rate": 1.9999999999999996e-07,
3401
+ "loss": 0.4897,
3402
+ "step": 5490
3403
+ },
3404
+ {
3405
+ "epoch": 69.62,
3406
+ "learning_rate": 3.3333333333333334e-08,
3407
+ "loss": 0.5564,
3408
+ "step": 5500
3409
+ },
3410
+ {
3411
+ "epoch": 69.62,
3412
+ "eval_cer": 0.19773618906387852,
3413
+ "eval_loss": 0.9461079239845276,
3414
+ "eval_runtime": 45.3275,
3415
+ "eval_samples_per_second": 10.612,
3416
+ "eval_steps_per_second": 1.346,
3417
+ "eval_wer": 0.5148362892223738,
3418
+ "step": 5500
3419
+ },
3420
+ {
3421
+ "epoch": 69.62,
3422
+ "step": 5500,
3423
+ "total_flos": 6.33124990225071e+19,
3424
+ "train_loss": 0.04894279766082764,
3425
+ "train_runtime": 2118.6173,
3426
+ "train_samples_per_second": 83.073,
3427
+ "train_steps_per_second": 2.596
3428
  }
3429
  ],
3430
+ "max_steps": 5500,
3431
+ "num_train_epochs": 70,
3432
+ "total_flos": 6.33124990225071e+19,
3433
  "trial_name": null,
3434
  "trial_params": null
3435
  }