Model save

Files changed (9) hide show

README.md CHANGED Viewed

@@ -40,8 +40,8 @@ The following hyperparameters were used during training:
 - eval_batch_size: 8
 - seed: 42
 - distributed_type: multi-GPU
-- gradient_accumulation_steps: 4
-- total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1

 - eval_batch_size: 8
 - seed: 42
 - distributed_type: multi-GPU
+- gradient_accumulation_steps: 8
+- total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1

adapter_config.json CHANGED Viewed

@@ -19,13 +19,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "k_proj",
-    "o_proj",
-    "down_proj",
-    "q_proj",
     "gate_proj",
     "v_proj",
-    "up_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "gate_proj",
+    "k_proj",
     "v_proj",
+    "q_proj",
+    "up_proj",
+    "down_proj",
+    "o_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:504cc70457d6aa2f64390f990c709688fd864a890f3aab7ed9e12586a2460d9f
 size 671150064

 version https://git-lfs.github.com/spec/v1
+oid sha256:bccf2aa6da043eaa987dcf38cf34fb3f402099f156d9fff0bf96e7d5fb411bf4
 size 671150064

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "train_loss": 0.5023353099822998,
-    "train_runtime": 47.6763,
-    "train_samples": 30,
-    "train_samples_per_second": 0.629,
-    "train_steps_per_second": 0.042
 }

 {
     "epoch": 1.0,
+    "train_loss": 0.5000961124897003,
+    "train_runtime": 87.0205,
+    "train_samples": 61,
+    "train_samples_per_second": 0.701,
+    "train_steps_per_second": 0.023
 }

runs/Apr18_13-12-45_104-171-203-159/events.out.tfevents.1713446020.104-171-203-159.3711193.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f683042e3a9dadac21d72be8a531f2f3f25cb8be0187be37127a1557957d6780
+size 5278

runs/Apr18_13-14-37_104-171-203-159/events.out.tfevents.1713446111.104-171-203-159.3712827.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:486ce07a04a64dde103b0947104165f83f3f4c8d2b961a6dd60467a29c64e55d
+size 6302

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "train_loss": 0.5023353099822998,
-    "train_runtime": 47.6763,
-    "train_samples": 30,
-    "train_samples_per_second": 0.629,
-    "train_steps_per_second": 0.042
 }

 {
     "epoch": 1.0,
+    "train_loss": 0.5000961124897003,
+    "train_runtime": 87.0205,
+    "train_samples": 61,
+    "train_samples_per_second": 0.701,
+    "train_steps_per_second": 0.023
 }

trainer_state.json CHANGED Viewed

@@ -10,27 +10,27 @@
   "log_history": [
     {
       "epoch": 0.5,
-      "grad_norm": 0.546875,
       "learning_rate": 5e-06,
-      "logits/chosen": -3.2339999675750732,
-      "logits/rejected": -3.2524003982543945,
-      "logps/chosen": -330.6106262207031,
-      "logps/rejected": -271.2039794921875,
-      "loss": 0.5011,
-      "rewards/accuracies": 0.4375,
-      "rewards/chosen": -0.037355951964855194,
-      "rewards/margins": -0.008914755657315254,
-      "rewards/rejected": -0.02844119817018509,
       "step": 1
     },
     {
       "epoch": 1.0,
       "step": 2,
       "total_flos": 0.0,
-      "train_loss": 0.5023353099822998,
-      "train_runtime": 47.6763,
-      "train_samples_per_second": 0.629,
-      "train_steps_per_second": 0.042
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 0.5,
+      "grad_norm": 0.58984375,
       "learning_rate": 5e-06,
+      "logits/chosen": -3.1927170753479004,
+      "logits/rejected": -3.1942551136016846,
+      "logps/chosen": -293.9735107421875,
+      "logps/rejected": -260.54400634765625,
+      "loss": 0.5,
+      "rewards/accuracies": 0.34375,
+      "rewards/chosen": -0.0009545064531266689,
+      "rewards/margins": -0.0002557558473199606,
+      "rewards/rejected": -0.0006987505475990474,
       "step": 1
     },
     {
       "epoch": 1.0,
       "step": 2,
       "total_flos": 0.0,
+      "train_loss": 0.5000961124897003,
+      "train_runtime": 87.0205,
+      "train_samples_per_second": 0.701,
+      "train_steps_per_second": 0.023
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:31ac445b754ae67bed5d7eeb0fe377d42820f5a6b19ee75b2727260bfe2e6ab2
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:b95677d0a8de9f9657c1c54ac2f6b2e70e6d9c418f6241dfcd95c3a94d606312
 size 5112