DUAL-GPO
/

zephyr-7b-gpo-iter2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-gpo-iter2 / adapter_model.safetensors

Commit History

Model save

6c1d38b
verified

lole25 commited on Apr 1

Training in progress, step 600

8413830
verified

lole25 commited on Apr 1

Training in progress, step 400

af878d4
verified

lole25 commited on Apr 1

Training in progress, step 300

14fe9fb
verified

lole25 commited on Apr 1

Training in progress, step 200

950c3cc
verified

lole25 commited on Apr 1

Training in progress, step 100

fd36013
verified

lole25 commited on Apr 1