tricktreat
/

Llama-2-7b-chat-hf-guanaco-freeze-embed-tokens-q-v-proj-lora

Model card Files Files and versions Metrics Training metrics Community

tricktreat commited on Apr 16

Commit

a4a02e4

•

1 Parent(s): c0ed9c6

Update README.md

Files changed (1) hide show

README.md +22 -1

README.md CHANGED Viewed

@@ -1,8 +1,29 @@
 ---
 library_name: peft
-base_model: guanaco_Llama-2-7b-chat-hf_freeze_embed_tokens_q_v_proj
 ---
 # Model Card for Model ID
 <!-- Provide a quick summary of what the model is/does. -->

 ---
 library_name: peft
+base_model: tricktreat/Llama-2-7b-chat-hf-guanaco-freeze-embed-tokens-q-v-proj
+license: apache-2.0
 ---
+# Training
+```
+deepspeed --include=node-0:3 --master_port=12001 sft_prompt_tuning.py --deepspeed dp_zero0.json \
+    --model_name_or_path="guanaco_Llama-2-7b-chat-hf_freeze_embed_tokens_q_v_proj" \
+    --dataset_name="timdettmers/openassistant-guanaco" \
+    --dataset_text_field="text" \
+    --report_to="tensorboard" \
+    --learning_rate=1e-5 \
+    --per_device_train_batch_size=32 \
+    --gradient_accumulation_steps=4 \
+    --output_dir="guanaco_Llama-2-7b-chat-hf_freeze_embed_tokens_q_v_projs_prompttuning" \
+    --logging_steps=1 \
+    --num_train_epochs=15 \
+    --max_steps=-1 \
+    --save_steps=0.3 \
+    --gradient_checkpointing \
+    --fp16
+```
 # Model Card for Model ID
 <!-- Provide a quick summary of what the model is/does. -->