DUAL-GPO
/

phi-2-gpo-iter-0

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

phi-2-gpo-iter-0 / training_args.bin

Commit History

Model save

503f00f
verified

lole25 commited on Mar 21

Model save

183a8fc
verified

lole25 commited on Mar 21

Model save

94e091f
verified

lole25 commited on Mar 21

Model save

e34affd
verified

lole25 commited on Mar 21

Model save

b047f45
verified

lole25 commited on Mar 20

Training in progress, step 100

b3fdd14
verified

lole25 commited on Mar 20

Model save

68b05e6
verified

lole25 commited on Mar 20