Youliang
/

llama3-70b-instruct-lora-derta-100step

Generated from Trainer

Model card Files Files and versions Community

Youliang commited on Jul 20, 2024

Commit

41db283

·

verified ·

1 Parent(s): c8cb8d7

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -34,14 +34,14 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0001
-- train_batch_size: 16
 - eval_batch_size: 1
 - seed: 1
 - distributed_type: multi-GPU
 - num_devices: 8
 - gradient_accumulation_steps: 2
 - total_train_batch_size: 128
-- total_eval_batch_size: 6
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - num_epochs: 2.0

 The following hyperparameters were used during training:
 - learning_rate: 0.0001
+- train_batch_size: 8
 - eval_batch_size: 1
 - seed: 1
 - distributed_type: multi-GPU
 - num_devices: 8
 - gradient_accumulation_steps: 2
 - total_train_batch_size: 128
+- total_eval_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - num_epochs: 2.0