marcel
/

wav2vec2-large-xlsr-53-german

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:415f789cebf94dc975e2af37856a750f6a78c4e12af0b81cbeef753992d90419
 size 2490339591

 version https://git-lfs.github.com/spec/v1
+oid sha256:6843bd4f71c5da6f742fb97ed4629615bebb3e739a7469bf65e972cec15e6ffb
 size 2490339591

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0dc27a79ad93085f47b570fdaf3825b555caa80cf07cabe1ba820b1fd6247b8a
 size 1262065048

 version https://git-lfs.github.com/spec/v1
+oid sha256:46921802d4224cbc87382a360359b0b60338b51f7ee0688a8fef26156d9c6937
 size 1262065048

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:69fca0da0f8fa986f151fcf8b07e0888193c079c13d2d8004abe9580c45c5584
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:0a9d74c7b8404ba33c7dc27d3f935915c03a1e67d4dcd0c32769deff9f16fe75
 size 623

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 2.8484231943031535,
-  "global_step": 2800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -104,11 +104,123 @@
       "eval_samples_per_second": 7.953,
       "eval_wer": 0.39256756756756755,
       "step": 2800
     }
   ],
   "max_steps": 29490,
   "num_train_epochs": 30,
-  "total_flos": 1.5548475390462444e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 6.103763987792472,
+  "global_step": 6000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 7.953,
       "eval_wer": 0.39256756756756755,
       "step": 2800
+    },
+    {
+      "epoch": 3.26,
+      "learning_rate": 0.0002720593308037254,
+      "loss": 0.2208,
+      "step": 3200
+    },
+    {
+      "epoch": 3.26,
+      "eval_loss": 0.40793511271476746,
+      "eval_runtime": 233.2565,
+      "eval_samples_per_second": 8.021,
+      "eval_wer": 0.3984029484029484,
+      "step": 3200
+    },
+    {
+      "epoch": 3.66,
+      "learning_rate": 0.0002679199724042773,
+      "loss": 0.2168,
+      "step": 3600
+    },
+    {
+      "epoch": 3.66,
+      "eval_loss": 0.40217384696006775,
+      "eval_runtime": 233.5419,
+      "eval_samples_per_second": 8.011,
+      "eval_wer": 0.40958230958230957,
+      "step": 3600
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 0.0002637806140048292,
+      "loss": 0.2059,
+      "step": 4000
+    },
+    {
+      "epoch": 4.07,
+      "eval_loss": 0.42218777537345886,
+      "eval_runtime": 233.047,
+      "eval_samples_per_second": 8.028,
+      "eval_wer": 0.40128992628992627,
+      "step": 4000
+    },
+    {
+      "epoch": 4.48,
+      "learning_rate": 0.0002596412556053811,
+      "loss": 0.1808,
+      "step": 4400
+    },
+    {
+      "epoch": 4.48,
+      "eval_loss": 0.43475455045700073,
+      "eval_runtime": 235.2511,
+      "eval_samples_per_second": 7.953,
+      "eval_wer": 0.39213759213759214,
+      "step": 4400
+    },
+    {
+      "epoch": 4.88,
+      "learning_rate": 0.0002555018972059331,
+      "loss": 0.1874,
+      "step": 4800
+    },
+    {
+      "epoch": 4.88,
+      "eval_loss": 0.40788909792900085,
+      "eval_runtime": 237.3453,
+      "eval_samples_per_second": 7.883,
+      "eval_wer": 0.3885749385749386,
+      "step": 4800
+    },
+    {
+      "epoch": 5.29,
+      "learning_rate": 0.000251362538806485,
+      "loss": 0.1671,
+      "step": 5200
+    },
+    {
+      "epoch": 5.29,
+      "eval_loss": 0.42425239086151123,
+      "eval_runtime": 235.3303,
+      "eval_samples_per_second": 7.951,
+      "eval_wer": 0.3864864864864865,
+      "step": 5200
+    },
+    {
+      "epoch": 5.7,
+      "learning_rate": 0.0002472231804070369,
+      "loss": 0.168,
+      "step": 5600
+    },
+    {
+      "epoch": 5.7,
+      "eval_loss": 0.39308613538742065,
+      "eval_runtime": 234.7832,
+      "eval_samples_per_second": 7.969,
+      "eval_wer": 0.38114250614250617,
+      "step": 5600
+    },
+    {
+      "epoch": 6.1,
+      "learning_rate": 0.0002430838220075888,
+      "loss": 0.1603,
+      "step": 6000
+    },
+    {
+      "epoch": 6.1,
+      "eval_loss": 0.4091956615447998,
+      "eval_runtime": 234.4154,
+      "eval_samples_per_second": 7.982,
+      "eval_wer": 0.38175675675675674,
+      "step": 6000
     }
   ],
   "max_steps": 29490,
   "num_train_epochs": 30,
+  "total_flos": 3.3303502305486766e+19,
   "trial_name": null,
   "trial_params": null
 }