bhalladitya
/

llva-1.5-7b-scicap

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

bhalladitya commited on Jul 9

Commit

d690c47

•

1 Parent(s): add6acc

End of training

Files changed (4) hide show

README.md +5 -5
adapter_config.json +9 -9
adapter_model.safetensors +1 -1
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 # llva-1.5-7b-scicap
-This model is a fine-tuned version of [llava-hf/llava-1.5-7b-hf](https://huggingface.co/llava-hf/llava-1.5-7b-hf) on an unknown dataset.
 ## Model description
@@ -35,12 +35,12 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1.4e-05
-- train_batch_size: 1
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 1
 - mixed_precision_training: Native AMP
 ### Training results
@@ -51,6 +51,6 @@ The following hyperparameters were used during training:
 - PEFT 0.11.1
 - Transformers 4.42.3
-- Pytorch 2.3.0+cu121
-- Datasets 2.20.0
 - Tokenizers 0.19.1

 # llva-1.5-7b-scicap
+This model is a fine-tuned version of [llava-hf/llava-1.5-7b-hf](https://huggingface.co/llava-hf/llava-1.5-7b-hf) on the None dataset.
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 1.4e-05
+- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 3
 - mixed_precision_training: Native AMP
 ### Training results
 - PEFT 0.11.1
 - Transformers 4.42.3
+- Pytorch 2.1.0
+- Datasets 2.15.0
 - Tokenizers 0.19.1

adapter_config.json CHANGED Viewed

@@ -23,19 +23,19 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "up_proj",
     "k_proj",
-    "v_proj",
-    "linear_2",
-    "o_proj",
     "linear_1",
-    "out_proj",
-    "fc2",
-    "gate_proj",
     "lm_head",
-    "q_proj",
-    "down_proj",
-    "fc1"
   ],
   "task_type": null,
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "down_proj",
+    "out_proj",
+    "fc2",
     "up_proj",
     "k_proj",
+    "q_proj",
     "linear_1",
+    "fc1",
+    "o_proj",
     "lm_head",
+    "gate_proj",
+    "v_proj",
+    "linear_2"
   ],
   "task_type": null,
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19dc14c53bafe6afa9c78a930a383b628cace71e3e0803bf68c9359b0a544605
 size 1290994752

 version https://git-lfs.github.com/spec/v1
+oid sha256:7a9028ff2d70894b667e158dc9cac01b6206af72306e06f416d55d6daadeaffa
 size 1290994752

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7922fefb0f15a9505ad74fb2b0c736514ee911fe6c680d3eb0e287f8f1526692
-size 5432

 version https://git-lfs.github.com/spec/v1
+oid sha256:22446ff6369ea64f604493a6bfa32948dcd2da3052de375ae8181a21576c8498
+size 5176