Menouar
/

falcon7b-linear-equations

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Menouar commited on Jan 29

Commit

9f6cdf5

•

1 Parent(s): ba81253

Model save

Files changed (1) hide show

README.md +4 -6

README.md CHANGED Viewed

@@ -5,8 +5,6 @@ tags:
 - trl
 - sft
 - generated_from_trainer
-datasets:
-- generator
 base_model: tiiuae/falcon-7b
 model-index:
 - name: falcon7b-linear-equations
@@ -18,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 # falcon7b-linear-equations
-This model is a fine-tuned version of [tiiuae/falcon-7b](https://huggingface.co/tiiuae/falcon-7b) on the generator dataset.
 ## Model description
@@ -38,15 +36,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 5
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 10
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
-- training_steps: 30
 ### Training results

 - trl
 - sft
 - generated_from_trainer
 base_model: tiiuae/falcon-7b
 model-index:
 - name: falcon7b-linear-equations
 # falcon7b-linear-equations
+This model is a fine-tuned version of [tiiuae/falcon-7b](https://huggingface.co/tiiuae/falcon-7b) on an unknown dataset.
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 10
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 20
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
+- training_steps: 400
 ### Training results