DUAL-GPO
/

zephyr-7b-gpo-iter0

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-gpo-iter0 / runs

Commit History

Model save

407a137
verified

lole25 commited on Mar 26

Training in progress, step 900

c55ea35
verified

lole25 commited on Mar 26

Training in progress, step 800

367b811
verified

lole25 commited on Mar 26

Training in progress, step 700

7961621
verified

lole25 commited on Mar 26

Training in progress, step 600

975e445
verified

lole25 commited on Mar 26

Training in progress, step 500

d9faacf
verified

lole25 commited on Mar 26

Training in progress, step 400

303877a
verified

lole25 commited on Mar 26

Training in progress, step 300

406cd53
verified

lole25 commited on Mar 26

Training in progress, step 200

9206188
verified

lole25 commited on Mar 26

Training in progress, step 100

b546555
verified

lole25 commited on Mar 26