Model save

Browse files

Files changed (8) hide show

README.md +38 -37
all_results.json +18 -4
eval_results.json +17 -0
runs/Sep20_09-49-50_xe8545-a100-29/events.out.tfevents.1726828563.xe8545-a100-29.128656.1 +3 -0
runs/Sep20_23-30-55_xe8545-a100-31/events.out.tfevents.1726868256.xe8545-a100-31.111265.0 +3 -0
train_results.json +4 -4
trainer_state.json +4 -4
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,6 +3,7 @@ library_name: transformers
 tags:
 - trl
 - cpo
 - generated_from_trainer
 model-index:
 - name: OpenELM-1_1B-SimPO
@@ -16,16 +17,16 @@ should probably proofread and complete it, then remove this comment. -->
 This model was trained from scratch on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.8496
-- Rewards/chosen: -1.1328
-- Rewards/rejected: -1.7031
 - Rewards/accuracies: 0.6680
 - Rewards/margins: 0.5742
-- Logps/rejected: -171.0
-- Logps/chosen: -113.0
-- Logits/rejected: 1.2422
-- Logits/chosen: -0.5781
-- Nll Loss: 0.0
 ## Model description
@@ -60,36 +61,36 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Rewards/chosen | Rewards/rejected | Rewards/accuracies | Rewards/margins | Logps/rejected | Logps/chosen | Logits/rejected | Logits/chosen | Nll Loss |
-|:-------------:|:------:|:----:|:---------------:|:--------------:|:----------------:|:------------------:|:---------------:|:--------------:|:------------:|:---------------:|:-------------:|:--------:|
-| 0.9346        | 0.1047 | 100  | 0.9349          | -0.3320        | -0.4180          | 0.6133             | 0.0864          | -41.75         | -33.25       | -7.9688         | -8.5625       | 0.0      |
-| 0.9139        | 0.2093 | 200  | 0.9069          | -0.4844        | -0.6367          | 0.6270             | 0.1504          | -63.5          | -48.5        | -2.4375         | -3.4531       | 0.0      |
-| 0.907         | 0.3140 | 300  | 0.9099          | -0.6914        | -0.8359          | 0.6055             | 0.1416          | -83.5          | -69.5        | -4.0            | -5.1875       | 0.0      |
-| 0.901         | 0.4186 | 400  | 0.8957          | -0.8359        | -1.0156          | 0.6328             | 0.1748          | -101.0         | -84.0        | 0.0164          | -1.7422       | 0.0      |
-| 0.8752        | 0.5233 | 500  | 0.8768          | -0.7266        | -0.9570          | 0.6582             | 0.2324          | -95.5          | -72.5        | 0.8555          | -0.5625       | 0.0      |
-| 0.8808        | 0.6279 | 600  | 0.8742          | -0.8633        | -1.0938          | 0.6445             | 0.2334          | -109.5         | -86.0        | 3.2344          | 2.1562        | 0.0      |
-| 0.8277        | 0.7326 | 700  | 0.8679          | -0.5195        | -0.7734          | 0.6445             | 0.2520          | -77.5          | -52.0        | 0.3496          | -0.7930       | 0.0      |
-| 0.8341        | 0.8373 | 800  | 0.8503          | -0.8047        | -1.0859          | 0.6602             | 0.2773          | -108.5         | -80.5        | 1.3047          | 0.2188        | 0.0      |
-| 0.8333        | 0.9419 | 900  | 0.8454          | -0.8984        | -1.2188          | 0.6660             | 0.3184          | -121.5         | -90.0        | 1.8438          | 0.6406        | 0.0      |
-| 0.8071        | 1.0466 | 1000 | 0.8441          | -1.0           | -1.3359          | 0.6699             | 0.3340          | -133.0         | -100.0       | 1.3516          | 0.1504        | 0.0      |
-| 0.7845        | 1.1512 | 1100 | 0.8307          | -0.8477        | -1.2266          | 0.6660             | 0.3809          | -122.5         | -84.5        | 0.3301          | -1.5078       | 0.0      |
-| 0.7483        | 1.2559 | 1200 | 0.8353          | -0.9453        | -1.3281          | 0.6758             | 0.3809          | -133.0         | -94.5        | 0.9805          | -0.4160       | 0.0      |
-| 0.7802        | 1.3605 | 1300 | 0.8363          | -0.6211        | -1.0             | 0.7051             | 0.3828          | -100.5         | -62.0        | 0.3418          | -1.5859       | 0.0      |
-| 0.7499        | 1.4652 | 1400 | 0.8228          | -0.9727        | -1.4141          | 0.7012             | 0.4414          | -141.0         | -97.0        | 1.4531          | -0.1719       | 0.0      |
-| 0.6966        | 1.5699 | 1500 | 0.8231          | -1.0625        | -1.5234          | 0.6836             | 0.4609          | -152.0         | -106.0       | 1.5             | -0.3301       | 0.0      |
-| 0.6921        | 1.6745 | 1600 | 0.8222          | -1.0703        | -1.5469          | 0.6875             | 0.4766          | -155.0         | -107.0       | 2.25            | 0.6133        | 0.0      |
-| 0.7162        | 1.7792 | 1700 | 0.8106          | -1.0312        | -1.5391          | 0.6953             | 0.5078          | -154.0         | -103.0       | 2.4688          | 0.6992        | 0.0      |
-| 0.714         | 1.8838 | 1800 | 0.8183          | -1.0938        | -1.625           | 0.6855             | 0.5312          | -162.0         | -109.5       | 2.1875          | 0.0579        | 0.0      |
-| 0.7068        | 1.9885 | 1900 | 0.8164          | -0.9727        | -1.5078          | 0.7031             | 0.5352          | -151.0         | -97.5        | 1.9922          | 0.3184        | 0.0      |
-| 0.4781        | 2.0931 | 2000 | 0.8475          | -1.1875        | -1.7109          | 0.6797             | 0.5273          | -171.0         | -119.0       | 1.7344          | 0.0977        | 0.0      |
-| 0.4964        | 2.1978 | 2100 | 0.8455          | -1.0           | -1.5547          | 0.6875             | 0.5547          | -155.0         | -100.0       | 0.9219          | -0.9258       | 0.0      |
-| 0.4723        | 2.3025 | 2200 | 0.8475          | -1.1016        | -1.6562          | 0.6934             | 0.5586          | -166.0         | -110.0       | 1.2969          | -0.4648       | 0.0      |
-| 0.5051        | 2.4071 | 2300 | 0.8480          | -1.1328        | -1.6953          | 0.6895             | 0.5664          | -170.0         | -113.0       | 1.4141          | -0.2891       | 0.0      |
-| 0.4647        | 2.5118 | 2400 | 0.8463          | -1.1406        | -1.7188          | 0.6758             | 0.5742          | -171.0         | -114.0       | 1.4531          | -0.3496       | 0.0      |
-| 0.4442        | 2.6164 | 2500 | 0.8527          | -1.2344        | -1.7969          | 0.6680             | 0.5664          | -180.0         | -123.5       | 1.5859          | -0.1436       | 0.0      |
-| 0.4349        | 2.7211 | 2600 | 0.8505          | -1.1172        | -1.6953          | 0.6699             | 0.5742          | -169.0         | -112.0       | 1.2422          | -0.5898       | 0.0      |
-| 0.4514        | 2.8257 | 2700 | 0.8493          | -1.1172        | -1.6953          | 0.6738             | 0.5781          | -169.0         | -112.0       | 1.1953          | -0.6406       | 0.0      |
-| 0.459         | 2.9304 | 2800 | 0.8496          | -1.1328        | -1.7031          | 0.6680             | 0.5742          | -171.0         | -113.0       | 1.2422          | -0.5781       | 0.0      |
 ### Framework versions

 tags:
 - trl
 - cpo
+- alignment-handbook
 - generated_from_trainer
 model-index:
 - name: OpenELM-1_1B-SimPO
 This model was trained from scratch on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Logits/chosen: -0.5781
+- Logits/rejected: 1.2422
+- Logps/chosen: -113.0
+- Logps/rejected: -171.0
 - Loss: 0.8496
+- Nll Loss: 0.0
 - Rewards/accuracies: 0.6680
+- Rewards/chosen: -1.1328
 - Rewards/margins: 0.5742
+- Rewards/rejected: -1.7031
 ## Model description
 ### Training results
+| Training Loss | Epoch  | Step | Logits/chosen | Logits/rejected | Logps/chosen | Logps/rejected | Validation Loss | Nll Loss | Rewards/accuracies | Rewards/chosen | Rewards/margins | Rewards/rejected |
+|:-------------:|:------:|:----:|:-------------:|:---------------:|:------------:|:--------------:|:---------------:|:--------:|:------------------:|:--------------:|:---------------:|:----------------:|
+| 0.9346        | 0.1047 | 100  | -8.5625       | -7.9688         | -33.25       | -41.75         | 0.9349          | 0.0      | 0.6133             | -0.3320        | 0.0864          | -0.4180          |
+| 0.9139        | 0.2093 | 200  | -3.4531       | -2.4375         | -48.5        | -63.5          | 0.9069          | 0.0      | 0.6270             | -0.4844        | 0.1504          | -0.6367          |
+| 0.907         | 0.3140 | 300  | -5.1875       | -4.0            | -69.5        | -83.5          | 0.9099          | 0.0      | 0.6055             | -0.6914        | 0.1416          | -0.8359          |
+| 0.901         | 0.4186 | 400  | -1.7422       | 0.0164          | -84.0        | -101.0         | 0.8957          | 0.0      | 0.6328             | -0.8359        | 0.1748          | -1.0156          |
+| 0.8752        | 0.5233 | 500  | -0.5625       | 0.8555          | -72.5        | -95.5          | 0.8768          | 0.0      | 0.6582             | -0.7266        | 0.2324          | -0.9570          |
+| 0.8808        | 0.6279 | 600  | 2.1562        | 3.2344          | -86.0        | -109.5         | 0.8742          | 0.0      | 0.6445             | -0.8633        | 0.2334          | -1.0938          |
+| 0.8277        | 0.7326 | 700  | -0.7930       | 0.3496          | -52.0        | -77.5          | 0.8679          | 0.0      | 0.6445             | -0.5195        | 0.2520          | -0.7734          |
+| 0.8341        | 0.8373 | 800  | 0.2188        | 1.3047          | -80.5        | -108.5         | 0.8503          | 0.0      | 0.6602             | -0.8047        | 0.2773          | -1.0859          |
+| 0.8333        | 0.9419 | 900  | 0.6406        | 1.8438          | -90.0        | -121.5         | 0.8454          | 0.0      | 0.6660             | -0.8984        | 0.3184          | -1.2188          |
+| 0.8071        | 1.0466 | 1000 | 0.1504        | 1.3516          | -100.0       | -133.0         | 0.8441          | 0.0      | 0.6699             | -1.0           | 0.3340          | -1.3359          |
+| 0.7845        | 1.1512 | 1100 | -1.5078       | 0.3301          | -84.5        | -122.5         | 0.8307          | 0.0      | 0.6660             | -0.8477        | 0.3809          | -1.2266          |
+| 0.7483        | 1.2559 | 1200 | -0.4160       | 0.9805          | -94.5        | -133.0         | 0.8353          | 0.0      | 0.6758             | -0.9453        | 0.3809          | -1.3281          |
+| 0.7802        | 1.3605 | 1300 | -1.5859       | 0.3418          | -62.0        | -100.5         | 0.8363          | 0.0      | 0.7051             | -0.6211        | 0.3828          | -1.0             |
+| 0.7499        | 1.4652 | 1400 | -0.1719       | 1.4531          | -97.0        | -141.0         | 0.8228          | 0.0      | 0.7012             | -0.9727        | 0.4414          | -1.4141          |
+| 0.6966        | 1.5699 | 1500 | -0.3301       | 1.5             | -106.0       | -152.0         | 0.8231          | 0.0      | 0.6836             | -1.0625        | 0.4609          | -1.5234          |
+| 0.6921        | 1.6745 | 1600 | 0.6133        | 2.25            | -107.0       | -155.0         | 0.8222          | 0.0      | 0.6875             | -1.0703        | 0.4766          | -1.5469          |
+| 0.7162        | 1.7792 | 1700 | 0.6992        | 2.4688          | -103.0       | -154.0         | 0.8106          | 0.0      | 0.6953             | -1.0312        | 0.5078          | -1.5391          |
+| 0.714         | 1.8838 | 1800 | 0.0579        | 2.1875          | -109.5       | -162.0         | 0.8183          | 0.0      | 0.6855             | -1.0938        | 0.5312          | -1.625           |
+| 0.7068        | 1.9885 | 1900 | 0.3184        | 1.9922          | -97.5        | -151.0         | 0.8164          | 0.0      | 0.7031             | -0.9727        | 0.5352          | -1.5078          |
+| 0.4781        | 2.0931 | 2000 | 0.0977        | 1.7344          | -119.0       | -171.0         | 0.8475          | 0.0      | 0.6797             | -1.1875        | 0.5273          | -1.7109          |
+| 0.4964        | 2.1978 | 2100 | -0.9258       | 0.9219          | -100.0       | -155.0         | 0.8455          | 0.0      | 0.6875             | -1.0           | 0.5547          | -1.5547          |
+| 0.4723        | 2.3025 | 2200 | -0.4648       | 1.2969          | -110.0       | -166.0         | 0.8475          | 0.0      | 0.6934             | -1.1016        | 0.5586          | -1.6562          |
+| 0.5051        | 2.4071 | 2300 | -0.2891       | 1.4141          | -113.0       | -170.0         | 0.8480          | 0.0      | 0.6895             | -1.1328        | 0.5664          | -1.6953          |
+| 0.4647        | 2.5118 | 2400 | -0.3496       | 1.4531          | -114.0       | -171.0         | 0.8463          | 0.0      | 0.6758             | -1.1406        | 0.5742          | -1.7188          |
+| 0.4442        | 2.6164 | 2500 | -0.1436       | 1.5859          | -123.5       | -180.0         | 0.8527          | 0.0      | 0.6680             | -1.2344        | 0.5664          | -1.7969          |
+| 0.4349        | 2.7211 | 2600 | -0.5898       | 1.2422          | -112.0       | -169.0         | 0.8505          | 0.0      | 0.6699             | -1.1172        | 0.5742          | -1.6953          |
+| 0.4514        | 2.8257 | 2700 | -0.6406       | 1.1953          | -112.0       | -169.0         | 0.8493          | 0.0      | 0.6738             | -1.1172        | 0.5781          | -1.6953          |
+| 0.459         | 2.9304 | 2800 | -0.5781       | 1.2422          | -113.0       | -171.0         | 0.8496          | 0.0      | 0.6680             | -1.1328        | 0.5742          | -1.7031          |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,9 +1,23 @@
 {
     "epoch": 2.998430141287284,
     "total_flos": 0.0,
-    "train_loss": 0.6978365646815009,
-    "train_runtime": 9531.6254,
     "train_samples": 61134,
-    "train_samples_per_second": 19.241,
-    "train_steps_per_second": 0.301
 }

 {
     "epoch": 2.998430141287284,
+    "eval_logits/chosen": -0.58203125,
+    "eval_logits/rejected": 1.25,
+    "eval_logps/chosen": -113.0,
+    "eval_logps/rejected": -171.0,
+    "eval_loss": 0.849609375,
+    "eval_nll_loss": 0.0,
+    "eval_rewards/accuracies": 0.671875,
+    "eval_rewards/chosen": -1.1328125,
+    "eval_rewards/margins": 0.578125,
+    "eval_rewards/rejected": -1.7109375,
+    "eval_runtime": 23.4202,
+    "eval_samples": 2000,
+    "eval_samples_per_second": 85.396,
+    "eval_steps_per_second": 1.366,
     "total_flos": 0.0,
+    "train_loss": 0.0,
+    "train_runtime": 0.0608,
     "train_samples": 61134,
+    "train_samples_per_second": 3016192.654,
+    "train_steps_per_second": 47117.218
 }

eval_results.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+    "epoch": 2.998430141287284,
+    "eval_logits/chosen": -0.58203125,
+    "eval_logits/rejected": 1.25,
+    "eval_logps/chosen": -113.0,
+    "eval_logps/rejected": -171.0,
+    "eval_loss": 0.849609375,
+    "eval_nll_loss": 0.0,
+    "eval_rewards/accuracies": 0.671875,
+    "eval_rewards/chosen": -1.1328125,
+    "eval_rewards/margins": 0.578125,
+    "eval_rewards/rejected": -1.7109375,
+    "eval_runtime": 23.4202,
+    "eval_samples": 2000,
+    "eval_samples_per_second": 85.396,
+    "eval_steps_per_second": 1.366
+}

runs/Sep20_09-49-50_xe8545-a100-29/events.out.tfevents.1726828563.xe8545-a100-29.128656.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f54ff415160a93eeb4abb8268739aab934edaaf7a214a1af1ad5eda8f7a419fb
+size 880

runs/Sep20_23-30-55_xe8545-a100-31/events.out.tfevents.1726868256.xe8545-a100-31.111265.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed5c2eb50ce1f7da96ed23a9b6d4c6ce1e1763304b972d9a0216c97d00abe07f
+size 7021

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 2.998430141287284,
     "total_flos": 0.0,
-    "train_loss": 0.6978365646815009,
-    "train_runtime": 9531.6254,
     "train_samples": 61134,
-    "train_samples_per_second": 19.241,
-    "train_steps_per_second": 0.301
 }

 {
     "epoch": 2.998430141287284,
     "total_flos": 0.0,
+    "train_loss": 0.0,
+    "train_runtime": 0.0608,
     "train_samples": 61134,
+    "train_samples_per_second": 3016192.654,
+    "train_steps_per_second": 47117.218
 }

trainer_state.json CHANGED Viewed

@@ -5064,10 +5064,10 @@
       "epoch": 2.998430141287284,
       "step": 2865,
       "total_flos": 0.0,
-      "train_loss": 0.6978365646815009,
-      "train_runtime": 9531.6254,
-      "train_samples_per_second": 19.241,
-      "train_steps_per_second": 0.301
     }
   ],
   "logging_steps": 10,

       "epoch": 2.998430141287284,
       "step": 2865,
       "total_flos": 0.0,
+      "train_loss": 0.0,
+      "train_runtime": 0.0608,
+      "train_samples_per_second": 3016192.654,
+      "train_steps_per_second": 47117.218
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9bf8efbd579435b40acda2065d64af78048348b10b59a95db4ff52b8b87aef58
 size 7096

 version https://git-lfs.github.com/spec/v1
+oid sha256:bcdda8008ea19009a4ce2844c0efd730904eb5a3978e7bc9c786856aede57e7d
 size 7096