Upload step 3000 checkpoint

Files changed (3) hide show

config.json CHANGED Viewed

@@ -117,7 +117,7 @@
     "kv_bridge_use_gate": false,
     "memory_mode": "replace",
     "memory_donor_layers": [
-      28
     ],
     "memory_share_donor_across_right_layers": true,
     "memory_reduce_strategy": "single"

     "kv_bridge_use_gate": false,
     "memory_mode": "replace",
     "memory_donor_layers": [
+      20
     ],
     "memory_share_donor_across_right_layers": true,
     "memory_reduce_strategy": "single"

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0f210e659ccf8f4fa961c2bcba4c22702bc119fe2bc3a3115df39311c0bf73b
 size 725313232

 version https://git-lfs.github.com/spec/v1
+oid sha256:632ab53f36f71ca625fcd40d849473cc0c173a3465f03c6b65319ca1146da51e
 size 725313232

train_config.json CHANGED Viewed

@@ -2,14 +2,14 @@
   "lr_mp": 0.0001,
   "lr_vision_backbone": 0.0,
   "lr_language_backbone": 0.0001,
-  "lr_right_tower": 0.0,
   "lr_kv_bridge": 0.0,
   "lr_activation_bridge": 0.0,
   "batch_size": 32,
   "gradient_accumulation_steps": 4,
   "max_grad_norm": 1.0,
   "max_training_steps": 10000,
-  "stop_after_step": 4100,
   "warmup_ratio": 0.03,
   "stats_log_interval": 100,
   "precision": "bf16",

   "lr_mp": 0.0001,
   "lr_vision_backbone": 0.0,
   "lr_language_backbone": 0.0001,
+  "lr_right_tower": 0.0001,
   "lr_kv_bridge": 0.0,
   "lr_activation_bridge": 0.0,
   "batch_size": 32,
   "gradient_accumulation_steps": 4,
   "max_grad_norm": 1.0,
   "max_training_steps": 10000,
+  "stop_after_step": 5100,
   "warmup_ratio": 0.03,
   "stats_log_interval": 100,
   "precision": "bf16",