lole25
/

phi-2-gpo-ultrachat-lora-0.1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-ultrachat-lora-0.1 / runs /Feb29_16-55-01_gpu4-119-4 /events.out.tfevents.1709187625.gpu4-119-4.1081689.1

Commit History

Model save

e412c7e
verified

lole25 commited on Feb 29