lole25
/

phi-2-dpo-ultrafeedback-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-ultrafeedback-lora / adapter_model.safetensors

Commit History

Model save

37f2f6b
verified

lole25 commited on Mar 4

Training in progress, step 900

74c72fc
verified

lole25 commited on Mar 4

Training in progress, step 800

39c636a
verified

lole25 commited on Mar 4

Training in progress, step 700

22f4a71
verified

lole25 commited on Mar 4

Training in progress, step 600

7ce904a
verified

lole25 commited on Mar 4

Training in progress, step 500

964e8fc
verified

lole25 commited on Mar 4

Training in progress, step 400

200217b
verified

lole25 commited on Mar 4

Training in progress, step 300

4a8e8be
verified

lole25 commited on Mar 4

Training in progress, step 200

7db3838
verified

lole25 commited on Mar 4

Training in progress, step 100

b8cb02a
verified

lole25 commited on Mar 4