Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

adapter_config.json +4 -4
adapter_model.safetensors +1 -1
optimizer.pt +1 -1
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +44 -44
training_args.bin +1 -1

adapter_config.json CHANGED Viewed

@@ -19,13 +19,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "up_proj",
-    "down_proj",
     "o_proj",
     "v_proj",
     "k_proj",
-    "q_proj",
-    "gate_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_rslora": false

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "o_proj",
+    "up_proj",
+    "q_proj",
+    "gate_proj",
     "v_proj",
     "k_proj",
+    "down_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_rslora": false

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a4bdfe21901b0e7f28208c1ff82244cdeca9afb0e3b600d06f0dbe0aae6f02db
 size 276869160

 version https://git-lfs.github.com/spec/v1
+oid sha256:8bafd3a985567d67290cc07b5ebe5f27e83549efae700a39e677272a413156ec
 size 276869160

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7278ab5383fb73f156876b77a470c29973f44e2a8f22b09fcd6c0923de141368
 size 553854714

 version https://git-lfs.github.com/spec/v1
+oid sha256:f4e1ee127ea3e984d65847f9f3f210e1c0ca73e881f8a0823b364a658868ef78
 size 553854714

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e319566a894c1c789e0dc6938468bf9d165f0503bd5dd83febd67de675e0453e
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:007b19f8cc7363dbd119b3a310ca27de8a43abefca81f682d933eed470b6b184
 size 14244

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ea6e04a1d21943153bccd8fabf6e768143cbd324f058ed3a0b5adbbae648857c
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b519929af133aadaab5e54d422c1341c550e265b55d133dc489fa6313be6ad6
 size 1064

trainer_state.json CHANGED Viewed

@@ -11,145 +11,145 @@
     {
       "epoch": 0.04,
       "learning_rate": 0.0,
-      "loss": 1.9142,
       "step": 2
     },
     {
       "epoch": 0.08,
       "learning_rate": 0.0,
-      "loss": 2.2468,
       "step": 4
     },
     {
       "epoch": 0.12,
       "learning_rate": 1e-05,
-      "loss": 2.3153,
       "step": 6
     },
     {
       "epoch": 0.16,
       "learning_rate": 1.9976687691905394e-05,
-      "loss": 2.3005,
       "step": 8
     },
     {
       "epoch": 0.21,
       "learning_rate": 1.9906859460363307e-05,
-      "loss": 2.4715,
       "step": 10
     },
     {
       "epoch": 0.25,
-      "learning_rate": 1.9906859460363307e-05,
-      "loss": 2.6328,
       "step": 12
     },
     {
       "epoch": 0.29,
-      "learning_rate": 1.9629172873477995e-05,
-      "loss": 1.9654,
       "step": 14
     },
     {
       "epoch": 0.33,
-      "learning_rate": 1.917211301505453e-05,
-      "loss": 2.1935,
       "step": 16
     },
     {
       "epoch": 0.37,
-      "learning_rate": 1.8544194045464888e-05,
-      "loss": 2.1805,
       "step": 18
     },
     {
       "epoch": 0.41,
-      "learning_rate": 1.77571129070442e-05,
-      "loss": 2.2827,
       "step": 20
     },
     {
       "epoch": 0.45,
-      "learning_rate": 1.6825531432186545e-05,
-      "loss": 2.3124,
       "step": 22
     },
     {
       "epoch": 0.49,
-      "learning_rate": 1.5766803221148676e-05,
-      "loss": 2.6128,
       "step": 24
     },
     {
       "epoch": 0.53,
-      "learning_rate": 1.4600650377311523e-05,
-      "loss": 1.8219,
       "step": 26
     },
     {
       "epoch": 0.57,
-      "learning_rate": 1.3348796121709862e-05,
-      "loss": 2.096,
       "step": 28
     },
     {
       "epoch": 0.62,
-      "learning_rate": 1.2034560130526341e-05,
-      "loss": 2.176,
       "step": 30
     },
     {
       "epoch": 0.66,
-      "learning_rate": 1.0682424133646712e-05,
-      "loss": 2.0975,
       "step": 32
     },
     {
       "epoch": 0.7,
-      "learning_rate": 9.317575866353293e-06,
-      "loss": 2.0707,
       "step": 34
     },
     {
       "epoch": 0.74,
-      "learning_rate": 7.965439869473664e-06,
-      "loss": 2.3809,
       "step": 36
     },
     {
       "epoch": 0.78,
-      "learning_rate": 6.651203878290139e-06,
-      "loss": 1.7672,
       "step": 38
     },
     {
       "epoch": 0.82,
-      "learning_rate": 5.399349622688479e-06,
-      "loss": 2.1201,
       "step": 40
     },
     {
       "epoch": 0.86,
-      "learning_rate": 4.2331967788513295e-06,
-      "loss": 2.1698,
       "step": 42
     },
     {
       "epoch": 0.9,
-      "learning_rate": 3.174468567813461e-06,
-      "loss": 2.0884,
       "step": 44
     },
     {
       "epoch": 0.94,
-      "learning_rate": 2.2428870929558012e-06,
-      "loss": 2.2344,
       "step": 46
     },
     {
       "epoch": 0.98,
-      "learning_rate": 1.4558059545351144e-06,
-      "loss": 2.3548,
       "step": 48
     }
   ],
@@ -158,7 +158,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
-  "total_flos": 4209565323866112.0,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

     {
       "epoch": 0.04,
       "learning_rate": 0.0,
+      "loss": 1.9361,
       "step": 2
     },
     {
       "epoch": 0.08,
       "learning_rate": 0.0,
+      "loss": 2.1523,
       "step": 4
     },
     {
       "epoch": 0.12,
       "learning_rate": 1e-05,
+      "loss": 2.2792,
       "step": 6
     },
     {
       "epoch": 0.16,
       "learning_rate": 1.9976687691905394e-05,
+      "loss": 2.2289,
       "step": 8
     },
     {
       "epoch": 0.21,
       "learning_rate": 1.9906859460363307e-05,
+      "loss": 2.2699,
       "step": 10
     },
     {
       "epoch": 0.25,
+      "learning_rate": 1.979084087682323e-05,
+      "loss": 2.5859,
       "step": 12
     },
     {
       "epoch": 0.29,
+      "learning_rate": 1.9422609221188208e-05,
+      "loss": 1.8846,
       "step": 14
     },
     {
       "epoch": 0.33,
+      "learning_rate": 1.8878852184023754e-05,
+      "loss": 2.2629,
       "step": 16
     },
     {
       "epoch": 0.37,
+      "learning_rate": 1.816969893010442e-05,
+      "loss": 2.1982,
       "step": 18
     },
     {
       "epoch": 0.41,
+      "learning_rate": 1.730835964278124e-05,
+      "loss": 2.2893,
       "step": 20
     },
     {
       "epoch": 0.45,
+      "learning_rate": 1.631087944326053e-05,
+      "loss": 2.1624,
       "step": 22
     },
     {
       "epoch": 0.49,
+      "learning_rate": 1.5195839500354337e-05,
+      "loss": 2.5566,
       "step": 24
     },
     {
       "epoch": 0.53,
+      "learning_rate": 1.3984010898462417e-05,
+      "loss": 1.9081,
       "step": 26
     },
     {
       "epoch": 0.57,
+      "learning_rate": 1.2697967711570243e-05,
+      "loss": 1.9444,
       "step": 28
     },
     {
       "epoch": 0.62,
+      "learning_rate": 1.1361666490962468e-05,
+      "loss": 2.1857,
       "step": 30
     },
     {
       "epoch": 0.66,
+      "learning_rate": 1e-05,
+      "loss": 2.1617,
       "step": 32
     },
     {
       "epoch": 0.7,
+      "learning_rate": 8.638333509037537e-06,
+      "loss": 2.3324,
       "step": 34
     },
     {
       "epoch": 0.74,
+      "learning_rate": 7.3020322884297565e-06,
+      "loss": 2.5691,
       "step": 36
     },
     {
       "epoch": 0.78,
+      "learning_rate": 6.015989101537586e-06,
+      "loss": 1.7745,
       "step": 38
     },
     {
       "epoch": 0.82,
+      "learning_rate": 4.804160499645667e-06,
+      "loss": 2.1199,
       "step": 40
     },
     {
       "epoch": 0.86,
+      "learning_rate": 3.689120556739475e-06,
+      "loss": 2.3115,
       "step": 42
     },
     {
       "epoch": 0.9,
+      "learning_rate": 2.691640357218759e-06,
+      "loss": 2.1067,
       "step": 44
     },
     {
       "epoch": 0.94,
+      "learning_rate": 1.8303010698955803e-06,
+      "loss": 2.1117,
       "step": 46
     },
     {
       "epoch": 0.98,
+      "learning_rate": 1.121147815976248e-06,
+      "loss": 2.3375,
       "step": 48
     }
   ],
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
+  "total_flos": 4218566835981312.0,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eb5fa794dd085c12ddd3821b61ce97da7a0bd8dc5401ea148d9aa0574571e0ce
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:27fc96fad5c4fb474362bc6a16da79d507da334907928c28f9c40352501fcf72
 size 4728