lole25
/

phi-2-gpo-lora-ultrafeedback-test

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-lora-ultrafeedback-test

Commit History

End of training

203b1c9
verified

lole25 commited on Mar 18, 2024

Model save

b146449
verified

lole25 commited on Mar 18, 2024

initial commit

a2363bb
verified

lole25 commited on Mar 18, 2024