lole25
/

phi-2-dpo-ultrachat-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-ultrachat-lora / runs /Mar01_07-41-58_gpu4-119-4

Commit History

Model save

b80f3e8
verified

lole25 commited on Feb 29

Training in progress, step 400

8314883
verified

lole25 commited on Feb 29

Training in progress, step 300

99d41a3
verified

lole25 commited on Feb 29

Training in progress, step 100

de8af52
verified

lole25 commited on Feb 29