Model save

Files changed (7) hide show

README.md CHANGED Viewed

@@ -1,13 +1,10 @@
 ---
 library_name: peft
 tags:
-- alignment-handbook
-- generated_from_trainer
 - trl
 - dpo
 base_model: DUAL-GPO-2/phi-2-gpo-v34-merged-i1
-datasets:
-- HuggingFaceH4/ultrafeedback_binarized
 model-index:
 - name: phi-2-gpo-20k-40k-60k-lora512-i2
   results: []
@@ -18,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 # phi-2-gpo-20k-40k-60k-lora512-i2
-This model is a fine-tuned version of [DUAL-GPO-2/phi-2-gpo-v34-merged-i1](https://huggingface.co/DUAL-GPO-2/phi-2-gpo-v34-merged-i1) on the HuggingFaceH4/ultrafeedback_binarized dataset.
 ## Model description

 ---
 library_name: peft
 tags:
 - trl
 - dpo
+- generated_from_trainer
 base_model: DUAL-GPO-2/phi-2-gpo-v34-merged-i1
 model-index:
 - name: phi-2-gpo-20k-40k-60k-lora512-i2
   results: []
 # phi-2-gpo-20k-40k-60k-lora512-i2
+This model is a fine-tuned version of [DUAL-GPO-2/phi-2-gpo-v34-merged-i1](https://huggingface.co/DUAL-GPO-2/phi-2-gpo-v34-merged-i1) on the None dataset.
 ## Model description

adapter_config.json CHANGED Viewed

@@ -21,8 +21,8 @@
   "target_modules": [
     "q_proj",
     "k_proj",
-    "v_proj",
-    "dense"
   ],
   "task_type": "CAUSAL_LM"
 }

   "target_modules": [
     "q_proj",
     "k_proj",
+    "dense",
+    "v_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "train_loss": 0.12654017809873971,
-    "train_runtime": 11344.5242,
     "train_samples": 61135,
-    "train_samples_per_second": 1.763,
-    "train_steps_per_second": 0.028
 }

 {
     "epoch": 1.0,
+    "train_loss": 0.004328498234733557,
+    "train_runtime": 430.9957,
     "train_samples": 61135,
+    "train_samples_per_second": 46.404,
+    "train_steps_per_second": 0.724
 }

runs/May18_18-44-20_ip-10-192-15-31/events.out.tfevents.1716058048.ip-10-192-15-31.2560.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6736606b52b20cc9f7741fe308e0b821bce3410df12b4d881c9a03d690940225
+size 5893

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "train_loss": 0.12654017809873971,
-    "train_runtime": 11344.5242,
     "train_samples": 61135,
-    "train_samples_per_second": 1.763,
-    "train_steps_per_second": 0.028
 }

 {
     "epoch": 1.0,
+    "train_loss": 0.004328498234733557,
+    "train_runtime": 430.9957,
     "train_samples": 61135,
+    "train_samples_per_second": 46.404,
+    "train_steps_per_second": 0.724
 }

trainer_state.json CHANGED Viewed

@@ -460,10 +460,10 @@
       "epoch": 1.0,
       "step": 312,
       "total_flos": 0.0,
-      "train_loss": 0.12654017809873971,
-      "train_runtime": 11344.5242,
-      "train_samples_per_second": 1.763,
-      "train_steps_per_second": 0.028
     }
   ],
   "logging_steps": 10,

       "epoch": 1.0,
       "step": 312,
       "total_flos": 0.0,
+      "train_loss": 0.004328498234733557,
+      "train_runtime": 430.9957,
+      "train_samples_per_second": 46.404,
+      "train_steps_per_second": 0.724
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a40c6e0b07f0202e23d909bf908663a28caeb57e248700e675db08c7dec827ab
 size 5880

 version https://git-lfs.github.com/spec/v1
+oid sha256:06e9a88bb53184451749fdd4cb47ba77e2d476f723fde7dd5cffd5d1f46aaa6f
 size 5880