zfz1
/

deepseek-8b-orpo-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

deepseek-8b-orpo-lora / runs

Commit History

End of training

dd36c6b
verified

zfz1 commited on Jul 18, 2024

Training in progress, step 312

062e283
verified

zfz1 commited on Jul 18, 2024

End of training

1075d3a
verified

zfz1 commited on Jul 15, 2024

Training in progress, step 312

759010b
verified

zfz1 commited on Jul 15, 2024