Model save

Browse files

Files changed (7) hide show

all_results.json +4 -4
model-00001-of-00003.safetensors +1 -1
model-00002-of-00003.safetensors +1 -1
model-00003-of-00003.safetensors +1 -1
train_results.json +4 -4
trainer_state.json +69 -69
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 0.992,
     "total_flos": 0.0,
-    "train_loss": 0.7687068062443887,
-    "train_runtime": 747.5876,
     "train_samples": 1999,
-    "train_samples_per_second": 2.674,
-    "train_steps_per_second": 0.083
 }

 {
     "epoch": 0.992,
     "total_flos": 0.0,
+    "train_loss": 0.7473330401605175,
+    "train_runtime": 796.1787,
     "train_samples": 1999,
+    "train_samples_per_second": 2.511,
+    "train_steps_per_second": 0.078
 }

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1c2b9bdb866fe09e4f9fb5e0f4cdc1c7f7a11f2068dfd2938eac0baaa24199c3
 size 4943162336

 version https://git-lfs.github.com/spec/v1
+oid sha256:8e3a19f872e7fb0e19870aba76ae3f5c9223b90ddf54797691e9076f6b9ab12e
 size 4943162336

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b2b14331f50809e47b874a6e162fa925e63750dd557297660ad89f89dc3f7d6
 size 4999819336

 version https://git-lfs.github.com/spec/v1
+oid sha256:59af0b2cca6f97a2cee171268613b799dfd21cfeca1485da4630ca5d2eac0ec5
 size 4999819336

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f4ecb43cb776e8ce67c7b7134790207215a0e51655651fbc28f0546750b0c333
 size 4540516344

 version https://git-lfs.github.com/spec/v1
+oid sha256:01242609eebd7a9d5c5bacafa974af69e25c4af122fcd83365210d342ac88bd7
 size 4540516344

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 0.992,
     "total_flos": 0.0,
-    "train_loss": 0.7687068062443887,
-    "train_runtime": 747.5876,
     "train_samples": 1999,
-    "train_samples_per_second": 2.674,
-    "train_steps_per_second": 0.083
 }

 {
     "epoch": 0.992,
     "total_flos": 0.0,
+    "train_loss": 0.7473330401605175,
+    "train_runtime": 796.1787,
     "train_samples": 1999,
+    "train_samples_per_second": 2.511,
+    "train_steps_per_second": 0.078
 }

trainer_state.json CHANGED Viewed

@@ -10,13 +10,13 @@
   "log_history": [
     {
       "epoch": 0.016,
-      "grad_norm": 52.54359963110853,
       "learning_rate": 7.142857142857142e-08,
-      "logits/generated": -2.6779448986053467,
-      "logits/real": -2.691202163696289,
-      "logps/generated": -74.53842163085938,
-      "logps/real": -93.44010925292969,
-      "loss": 0.7913,
       "rewards/accuracies": 0.0,
       "rewards/generated": 0.0,
       "rewards/margins": 0.0,
@@ -25,102 +25,102 @@
     },
     {
       "epoch": 0.16,
-      "grad_norm": 28.122526927341976,
       "learning_rate": 4.727272727272727e-07,
-      "logits/generated": -2.5826447010040283,
-      "logits/real": -2.572615385055542,
-      "logps/generated": -123.79043579101562,
-      "logps/real": -108.88796997070312,
-      "loss": 0.7974,
-      "rewards/accuracies": 0.25,
-      "rewards/generated": -0.017271483317017555,
-      "rewards/margins": 0.0596686527132988,
-      "rewards/real": 0.04239716753363609,
       "step": 10
     },
     {
       "epoch": 0.32,
-      "grad_norm": 44.434349792005534,
       "learning_rate": 3.818181818181818e-07,
-      "logits/generated": -2.709092378616333,
-      "logits/real": -2.6981873512268066,
-      "logps/generated": -99.3179702758789,
-      "logps/real": -96.93788146972656,
-      "loss": 0.7883,
-      "rewards/accuracies": 0.25,
-      "rewards/generated": 1.0143389701843262,
-      "rewards/margins": 0.029613429680466652,
-      "rewards/real": 1.043952226638794,
       "step": 20
     },
     {
       "epoch": 0.48,
-      "grad_norm": 45.15314438688675,
       "learning_rate": 2.909090909090909e-07,
-      "logits/generated": -2.633875846862793,
-      "logits/real": -2.6102986335754395,
-      "logps/generated": -110.6008071899414,
-      "logps/real": -97.6747817993164,
-      "loss": 0.7362,
-      "rewards/accuracies": 0.30000001192092896,
-      "rewards/generated": 0.7923309206962585,
-      "rewards/margins": 0.15161481499671936,
-      "rewards/real": 0.9439458847045898,
       "step": 30
     },
     {
       "epoch": 0.64,
-      "grad_norm": 65.12954197470013,
       "learning_rate": 2e-07,
-      "logits/generated": -2.7233123779296875,
-      "logits/real": -2.6725680828094482,
-      "logps/generated": -126.6224594116211,
-      "logps/real": -109.69065856933594,
-      "loss": 0.7946,
-      "rewards/accuracies": 0.32499998807907104,
-      "rewards/generated": 0.30916541814804077,
-      "rewards/margins": 0.30192217230796814,
-      "rewards/real": 0.6110875010490417,
       "step": 40
     },
     {
       "epoch": 0.8,
-      "grad_norm": 54.78449313424441,
       "learning_rate": 1.0909090909090908e-07,
-      "logits/generated": -2.696377992630005,
-      "logits/real": -2.7040600776672363,
-      "logps/generated": -105.97816467285156,
-      "logps/real": -98.66194915771484,
-      "loss": 0.7688,
-      "rewards/accuracies": 0.16249999403953552,
-      "rewards/generated": 1.6170318126678467,
-      "rewards/margins": 0.025405455380678177,
-      "rewards/real": 1.6424373388290405,
       "step": 50
     },
     {
       "epoch": 0.96,
-      "grad_norm": 34.743799756626075,
       "learning_rate": 1.818181818181818e-08,
-      "logits/generated": -2.609443187713623,
-      "logits/real": -2.639867067337036,
-      "logps/generated": -116.21678161621094,
-      "logps/real": -96.13401794433594,
-      "loss": 0.7323,
       "rewards/accuracies": 0.2750000059604645,
-      "rewards/generated": 1.5233509540557861,
-      "rewards/margins": 0.1510307937860489,
-      "rewards/real": 1.6743818521499634,
       "step": 60
     },
     {
       "epoch": 0.992,
       "step": 62,
       "total_flos": 0.0,
-      "train_loss": 0.7687068062443887,
-      "train_runtime": 747.5876,
-      "train_samples_per_second": 2.674,
-      "train_steps_per_second": 0.083
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.016,
+      "grad_norm": 30.93577209985028,
       "learning_rate": 7.142857142857142e-08,
+      "logits/generated": -2.6151156425476074,
+      "logits/real": -2.56895112991333,
+      "logps/generated": -100.78079223632812,
+      "logps/real": -84.83761596679688,
+      "loss": 0.7771,
       "rewards/accuracies": 0.0,
       "rewards/generated": 0.0,
       "rewards/margins": 0.0,
     },
     {
       "epoch": 0.16,
+      "grad_norm": 53.91196703984471,
       "learning_rate": 4.727272727272727e-07,
+      "logits/generated": -2.4759128093719482,
+      "logits/real": -2.5104005336761475,
+      "logps/generated": -110.86439514160156,
+      "logps/real": -96.45692443847656,
+      "loss": 0.7744,
+      "rewards/accuracies": 0.1944444477558136,
+      "rewards/generated": 0.4696773886680603,
+      "rewards/margins": 0.184379443526268,
+      "rewards/real": 0.6540568470954895,
       "step": 10
     },
     {
       "epoch": 0.32,
+      "grad_norm": 41.533419926208836,
       "learning_rate": 3.818181818181818e-07,
+      "logits/generated": -2.7200608253479004,
+      "logits/real": -2.7094995975494385,
+      "logps/generated": -111.71916198730469,
+      "logps/real": -97.46357727050781,
+      "loss": 0.7549,
+      "rewards/accuracies": 0.16249999403953552,
+      "rewards/generated": 1.2888102531433105,
+      "rewards/margins": 0.058855485171079636,
+      "rewards/real": 1.347665548324585,
       "step": 20
     },
     {
       "epoch": 0.48,
+      "grad_norm": 28.929547003454825,
       "learning_rate": 2.909090909090909e-07,
+      "logits/generated": -2.762415885925293,
+      "logits/real": -2.7689743041992188,
+      "logps/generated": -84.8138656616211,
+      "logps/real": -86.74251556396484,
+      "loss": 0.7391,
+      "rewards/accuracies": 0.23749999701976776,
+      "rewards/generated": 1.5304011106491089,
+      "rewards/margins": 0.12500552833080292,
+      "rewards/real": 1.6554067134857178,
       "step": 30
     },
     {
       "epoch": 0.64,
+      "grad_norm": 27.557827905589537,
       "learning_rate": 2e-07,
+      "logits/generated": -2.7791144847869873,
+      "logits/real": -2.817704916000366,
+      "logps/generated": -101.5577163696289,
+      "logps/real": -89.77957153320312,
+      "loss": 0.7543,
+      "rewards/accuracies": 0.20000000298023224,
+      "rewards/generated": 1.3332226276397705,
+      "rewards/margins": 0.20582261681556702,
+      "rewards/real": 1.5390453338623047,
       "step": 40
     },
     {
       "epoch": 0.8,
+      "grad_norm": 38.68815181578532,
       "learning_rate": 1.0909090909090908e-07,
+      "logits/generated": -2.7200920581817627,
+      "logits/real": -2.7181735038757324,
+      "logps/generated": -101.0867691040039,
+      "logps/real": -86.67424011230469,
+      "loss": 0.7238,
+      "rewards/accuracies": 0.23749999701976776,
+      "rewards/generated": 1.2783713340759277,
+      "rewards/margins": 0.4123215675354004,
+      "rewards/real": 1.6906929016113281,
       "step": 50
     },
     {
       "epoch": 0.96,
+      "grad_norm": 27.90637817594034,
       "learning_rate": 1.818181818181818e-08,
+      "logits/generated": -2.6357321739196777,
+      "logits/real": -2.649296522140503,
+      "logps/generated": -121.07977294921875,
+      "logps/real": -98.04679107666016,
+      "loss": 0.732,
       "rewards/accuracies": 0.2750000059604645,
+      "rewards/generated": 0.9751936197280884,
+      "rewards/margins": 0.5532658100128174,
+      "rewards/real": 1.5284594297409058,
       "step": 60
     },
     {
       "epoch": 0.992,
       "step": 62,
       "total_flos": 0.0,
+      "train_loss": 0.7473330401605175,
+      "train_runtime": 796.1787,
+      "train_samples_per_second": 2.511,
+      "train_steps_per_second": 0.078
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:159fef2ce51b22c7f5d1faead1105882d5e9288a7d66381f5668c6e5ecd11177
 size 6392

 version https://git-lfs.github.com/spec/v1
+oid sha256:a195599b62489affb65b07d3476c850902409ec25a72a42aac6a5edc1c41eb2b
 size 6392