statking
/

Meta-Llama-3-8B-Instruct-DPO-QLoRA

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

Meta-Llama-3-8B-Instruct-DPO-QLoRA / adapter_model.safetensors

Commit History

Training in progress, step 100

fdbeed8
verified

statking commited on May 21