Refresh base adapter to best eval_loss (profile=qwen3_5_9b, step=288, eval_loss=0.045270)

Files changed (3) hide show

qwen__qwen3.5-9b/adapter_config.json CHANGED Viewed

@@ -33,16 +33,16 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "out_proj",
-    "k_proj",
     "q_proj",
     "v_proj",
-    "down_proj",
     "o_proj",
     "in_proj_qkv",
     "in_proj_z",
-    "gate_proj",
-    "up_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "down_proj",
     "out_proj",
     "q_proj",
     "v_proj",
+    "gate_proj",
     "o_proj",
+    "up_proj",
     "in_proj_qkv",
     "in_proj_z",
+    "k_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

qwen__qwen3.5-9b/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:486ed260350c203aee8100eac07c25e4103d918c3f5186932be4241c6b2d800f
 size 80275624

 version https://git-lfs.github.com/spec/v1
+oid sha256:29be519746ededecbd60e5efc79aa9aa9ecd81e82762ee80c2845b9234510d85
 size 80275624

qwen__qwen3.5-9b/best_eval_metrics.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_eval_loss": 0.037669453769922256,
-  "best_step": 1152,
-  "epoch": 2.0034782608695654
 }

 {
+  "best_eval_loss": 0.04526974633336067,
+  "best_step": 288,
+  "epoch": 0.5008695652173913
 }