Model save

Files changed (9) hide show

adapter_config.json CHANGED Viewed

@@ -20,13 +20,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "o_proj",
-    "q_proj",
-    "down_proj",
     "up_proj",
-    "gate_proj",
     "k_proj",
-    "v_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "gate_proj",
     "o_proj",
     "up_proj",
+    "v_proj",
     "k_proj",
+    "down_proj",
+    "q_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 1.0,
-    "eval_loss": 2.566110134124756,
-    "eval_runtime": 0.2859,
-    "eval_samples": 4,
-    "eval_samples_per_second": 13.992,
-    "eval_steps_per_second": 3.498,
     "train_loss": 1.4264578819274902,
-    "train_runtime": 2.0986,
     "train_samples": 4,
-    "train_samples_per_second": 1.906,
-    "train_steps_per_second": 0.477
 }

 {
     "epoch": 1.0,
+    "eval_loss": 2.88632869720459,
+    "eval_runtime": 0.2446,
+    "eval_samples": 2,
+    "eval_samples_per_second": 8.177,
+    "eval_steps_per_second": 4.088,
     "train_loss": 1.4264578819274902,
+    "train_runtime": 2.1851,
     "train_samples": 4,
+    "train_samples_per_second": 1.831,
+    "train_steps_per_second": 0.458
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "eval_loss": 2.566110134124756,
-    "eval_runtime": 0.2859,
-    "eval_samples": 4,
-    "eval_samples_per_second": 13.992,
-    "eval_steps_per_second": 3.498
 }

 {
     "epoch": 1.0,
+    "eval_loss": 2.88632869720459,
+    "eval_runtime": 0.2446,
+    "eval_samples": 2,
+    "eval_samples_per_second": 8.177,
+    "eval_steps_per_second": 4.088
 }

runs/May23_17-23-15_scai5.cs.ucla.edu/events.out.tfevents.1716510216.scai5.cs.ucla.edu.1148301.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f7dffe824613da7fca773b37392fb6efbd47d6edfffb21d40832514fc4f8c9a1
+size 354

runs/May23_17-24-03_scai5.cs.ucla.edu/events.out.tfevents.1716510252.scai5.cs.ucla.edu.1148436.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cebaa8888007198a0645dc594003fb9675e1ae7ac03ddba35cf95bf2bc1e2c61
+size 5840

tokenizer.json CHANGED Viewed

@@ -1,11 +1,6 @@
 {
   "version": "1.0",
-  "truncation": {
-    "direction": "Right",
-    "max_length": 2048,
-    "strategy": "LongestFirst",
-    "stride": 0
-  },
   "padding": null,
   "added_tokens": [
     {

 {
   "version": "1.0",
+  "truncation": null,
   "padding": null,
   "added_tokens": [
     {

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "train_loss": 1.4264578819274902,
-    "train_runtime": 2.0986,
     "train_samples": 4,
-    "train_samples_per_second": 1.906,
-    "train_steps_per_second": 0.477
 }

 {
     "epoch": 1.0,
     "train_loss": 1.4264578819274902,
+    "train_runtime": 2.1851,
     "train_samples": 4,
+    "train_samples_per_second": 1.831,
+    "train_steps_per_second": 0.458
 }

trainer_state.json CHANGED Viewed

@@ -17,9 +17,9 @@
     {
       "epoch": 1.0,
       "eval_loss": 2.88632869720459,
-      "eval_runtime": 0.263,
-      "eval_samples_per_second": 7.604,
-      "eval_steps_per_second": 3.802,
       "step": 1
     },
     {
@@ -27,9 +27,9 @@
       "step": 1,
       "total_flos": 32602467598336.0,
       "train_loss": 1.4264578819274902,
-      "train_runtime": 2.0986,
-      "train_samples_per_second": 1.906,
-      "train_steps_per_second": 0.477
     }
   ],
   "logging_steps": 5,

     {
       "epoch": 1.0,
       "eval_loss": 2.88632869720459,
+      "eval_runtime": 0.2519,
+      "eval_samples_per_second": 7.939,
+      "eval_steps_per_second": 3.97,
       "step": 1
     },
     {
       "step": 1,
       "total_flos": 32602467598336.0,
       "train_loss": 1.4264578819274902,
+      "train_runtime": 2.1851,
+      "train_samples_per_second": 1.831,
+      "train_steps_per_second": 0.458
     }
   ],
   "logging_steps": 5,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f34f7e356f32afb3f6b92b747a154e8890a05871c5f1c11868b6a2373cc17df
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:a78b1b5ecd61c0f19d7e87616d1c69a14e871e3ff14767eec8de5780708ea5ab
 size 4920