lole25
/

phi-2-ipo-ultrafeedback-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-ipo-ultrafeedback-lora / adapter_model.safetensors

Commit History

Model save

4bd8d55
verified

lole25 commited on Mar 4

Training in progress, step 900

b725940
verified

lole25 commited on Mar 4

Training in progress, step 800

f8fb2cf
verified

lole25 commited on Mar 4

Training in progress, step 700

8eeb77b
verified

lole25 commited on Mar 4

Training in progress, step 600

2a3d189
verified

lole25 commited on Mar 4

Training in progress, step 500

0e42544
verified

lole25 commited on Mar 4

Training in progress, step 400

2bf76e5
verified

lole25 commited on Mar 4

Training in progress, step 200

bb35abe
verified

lole25 commited on Mar 4

Training in progress, step 100

db8481c
verified

lole25 commited on Mar 4