DUAL-GPO
/

phi-2-gpo-test-longest-iter-v1-0

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

phi-2-gpo-test-longest-iter-v1-0 / adapter_model.safetensors

Commit History

Model save

cec2911
verified

BraylonDash commited on Mar 26

Training in progress, step 200

44236d0
verified

BraylonDash commited on Mar 26