DUAL-GPO
/

zephyr-7b-gpo-iter1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-gpo-iter1 / adapter_model.safetensors

Commit History

Training in progress, step 1000

71cdc77
verified

lole25 commited on Mar 29

Training in progress, step 900

b71e319
verified

lole25 commited on Mar 29

Training in progress, step 800

0002c79
verified

lole25 commited on Mar 29

Training in progress, step 700

531483f
verified

lole25 commited on Mar 29

Training in progress, step 600

3e84082
verified

lole25 commited on Mar 29

Training in progress, step 500

5db99e4
verified

lole25 commited on Mar 29

Training in progress, step 400

1af99a7
verified

lole25 commited on Mar 29

Training in progress, step 300

e82be8b
verified

lole25 commited on Mar 29

Training in progress, step 200

79f5683
verified

lole25 commited on Mar 29

Training in progress, step 100

883507a
verified

lole25 commited on Mar 29