lole25
/

phi-2-gpo-lora-ultrafeedback-test-1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-lora-ultrafeedback-test-1

1 contributor

History: 1 commit

lole25's picture

initial commit

272397b verified 8 months ago

.gitattributes

1.52 kB

initial commit 8 months ago