Tatiana239
/

zephyr-med

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Tatiana239 commited on Dec 14, 2023

Commit

4e022f7

·

1 Parent(s): 98d27b3

End of training

Files changed (1) hide show

README.md +3 -25

README.md CHANGED Viewed

@@ -30,33 +30,11 @@ More information needed
 ## Training procedure
-The following `bitsandbytes` quantization config was used during training:
-- quant_method: gptq
-- bits: 4
-- tokenizer: None
-- dataset: None
-- group_size: 128
-- damp_percent: 0.1
-- desc_act: True
-- sym: True
-- true_sequential: True
-- use_cuda_fp16: False
-- model_seqlen: 4096
-- block_name_to_quantize: model.layers
-- module_name_preceding_first_block: ['model.embed_tokens']
-- batch_size: 1
-- pad_token_id: None
-- use_exllama: False
-- max_input_length: None
-- exllama_config: {'version': <ExllamaVersion.ONE: 1>}
-- cache_block_outputs: True
 ### Training hyperparameters
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
@@ -70,8 +48,8 @@ The following hyperparameters were used during training:
 ### Framework versions
-- PEFT 0.7.0
-- Transformers 4.36.0
 - Pytorch 2.1.0+cu118
 - Datasets 2.15.0
 - Tokenizers 0.15.0

 ## Training procedure
 ### Training hyperparameters
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 ### Framework versions
+- PEFT 0.7.1
+- Transformers 4.36.1
 - Pytorch 2.1.0+cu118
 - Datasets 2.15.0
 - Tokenizers 0.15.0