Model save

Files changed (8) hide show

README.md CHANGED Viewed

@@ -64,8 +64,8 @@ The following hyperparameters were used during training:
 |:-------------:|:-----:|:----:|:-------------:|:---------------:|:------------:|:--------------:|:---------------:|:------------------:|:--------------:|:---------------:|:----------------:|
 | 0.5666        | 0.21  | 100  | -1.6453       | -1.5540         | -378.9401    | -411.0335      | 0.5780          | 0.7282             | -0.9484        | 0.5442          | -1.4926          |
 | 0.5107        | 0.42  | 200  | -0.1291       | 0.3999          | -386.8341    | -445.9254      | 0.5233          | 0.7480             | -1.0273        | 0.8142          | -1.8415          |
-| 0.5036        | 0.63  | 300  | 0.5109        | -1.0310         | -1.8791      | 0.7599         | 0.8481          | -449.6839          | -387.1995      | 0.7446          | -0.0425          |
-| 0.485         | 0.84  | 400  | 0.5047        | -1.1308         | -2.0694      | 0.7639         | 0.9387          | -468.7184          | -397.1799      | 0.9022          | 0.0635           |
 ### Framework versions

 |:-------------:|:-----:|:----:|:-------------:|:---------------:|:------------:|:--------------:|:---------------:|:------------------:|:--------------:|:---------------:|:----------------:|
 | 0.5666        | 0.21  | 100  | -1.6453       | -1.5540         | -378.9401    | -411.0335      | 0.5780          | 0.7282             | -0.9484        | 0.5442          | -1.4926          |
 | 0.5107        | 0.42  | 200  | -0.1291       | 0.3999          | -386.8341    | -445.9254      | 0.5233          | 0.7480             | -1.0273        | 0.8142          | -1.8415          |
+| 0.5036        | 0.63  | 300  | -0.0425       | 0.7446          | -387.1995    | -449.6839      | 0.5109          | 0.7599             | -1.0310        | 0.8481          | -1.8791          |
+| 0.485         | 0.84  | 400  | 0.0635        | 0.9022          | -397.1799    | -468.7184      | 0.5047          | 0.7639             | -1.1308        | 0.9387          | -2.0694          |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -9,13 +9,13 @@
     "eval_rewards/chosen": -1.1057459115982056,
     "eval_rewards/margins": 0.9401550889015198,
     "eval_rewards/rejected": -2.04590106010437,
-    "eval_runtime": 208.7421,
     "eval_samples": 2000,
-    "eval_samples_per_second": 9.581,
-    "eval_steps_per_second": 0.302,
-    "train_loss": 0.2921084338014231,
-    "train_runtime": 10286.7931,
     "train_samples": 61135,
-    "train_samples_per_second": 5.943,
-    "train_steps_per_second": 0.046
 }

     "eval_rewards/chosen": -1.1057459115982056,
     "eval_rewards/margins": 0.9401550889015198,
     "eval_rewards/rejected": -2.04590106010437,
+    "eval_runtime": 207.7886,
     "eval_samples": 2000,
+    "eval_samples_per_second": 9.625,
+    "eval_steps_per_second": 0.303,
+    "train_loss": 0.08043583084202413,
+    "train_runtime": 2697.0957,
     "train_samples": 61135,
+    "train_samples_per_second": 22.667,
+    "train_steps_per_second": 0.177
 }

eval_results.json CHANGED Viewed

@@ -9,8 +9,8 @@
     "eval_rewards/chosen": -1.1057459115982056,
     "eval_rewards/margins": 0.9401550889015198,
     "eval_rewards/rejected": -2.04590106010437,
-    "eval_runtime": 208.7421,
     "eval_samples": 2000,
-    "eval_samples_per_second": 9.581,
-    "eval_steps_per_second": 0.302
 }

     "eval_rewards/chosen": -1.1057459115982056,
     "eval_rewards/margins": 0.9401550889015198,
     "eval_rewards/rejected": -2.04590106010437,
+    "eval_runtime": 207.7886,
     "eval_samples": 2000,
+    "eval_samples_per_second": 9.625,
+    "eval_steps_per_second": 0.303
 }

runs/Feb22_16-18-37_cn-g029.server.mila.quebec/events.out.tfevents.1708636793.cn-g029.server.mila.quebec.2844469.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0d61e540ca6ac95e2922448e9ba4259b1f1c163dc2c948eada0491b75ac1cd1
+size 9463

runs/Feb22_16-18-37_cn-g029.server.mila.quebec/events.out.tfevents.1708639698.cn-g029.server.mila.quebec.2844469.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b0e05dac2b4618153922604b90ff8e79765cfa5c38573e9b0cd9e0fb68e531c
+size 828

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "train_loss": 0.2921084338014231,
-    "train_runtime": 10286.7931,
     "train_samples": 61135,
-    "train_samples_per_second": 5.943,
-    "train_steps_per_second": 0.046
 }

 {
     "epoch": 1.0,
+    "train_loss": 0.08043583084202413,
+    "train_runtime": 2697.0957,
     "train_samples": 61135,
+    "train_samples_per_second": 22.667,
+    "train_steps_per_second": 0.177
 }

trainer_state.json CHANGED Viewed

@@ -748,10 +748,10 @@
       "epoch": 1.0,
       "step": 477,
       "total_flos": 0.0,
-      "train_loss": 0.2921084338014231,
-      "train_runtime": 10286.7931,
-      "train_samples_per_second": 5.943,
-      "train_steps_per_second": 0.046
     }
   ],
   "logging_steps": 10,

       "epoch": 1.0,
       "step": 477,
       "total_flos": 0.0,
+      "train_loss": 0.08043583084202413,
+      "train_runtime": 2697.0957,
+      "train_samples_per_second": 22.667,
+      "train_steps_per_second": 0.177
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:69a789519b0b0d251c1235be8592d4f9fa808bc80130d806801cc3e06d793a33
 size 6072

 version https://git-lfs.github.com/spec/v1
+oid sha256:fec71fa8f0c6a223ade55eb038408c955538877668aaefaf5bbd56372333a2e7
 size 6072