DUAL-GPO
/

phi-2-gpo-test-longest-iter-random2-0

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

phi-2-gpo-test-longest-iter-random2-0

Commit History

End of training

c93c726
verified

BraylonDash commited on Mar 27

Model save

ba1b430
verified

BraylonDash commited on Mar 27

Training in progress, step 200

38fc80f
verified

BraylonDash commited on Mar 27

Training in progress, step 100

7e68ea0
verified

BraylonDash commited on Mar 27

initial commit

93bd02f
verified

BraylonDash commited on Mar 27