lole25
/

phi-2-dpo-ultrachat-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-ultrachat-lora / runs /Mar01_10-22-14_gpu4-119-4

Commit History

Model save

c5be93f
verified

lole25 commited on Mar 1

Training in progress, step 900

5cce308
verified

lole25 commited on Mar 1

Training in progress, step 800

04fbb1c
verified

lole25 commited on Mar 1

Training in progress, step 700

1625e58
verified

lole25 commited on Mar 1

Training in progress, step 600

79f9899
verified

lole25 commited on Mar 1