DUAL-GPO
/

phi-2-dpo-chatml-lora-0k-20k-i2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-chatml-lora-0k-20k-i2

Commit History

End of training

a5996ad
verified

BraylonDash commited on Sep 13

Model save

a0c1f08
verified

BraylonDash commited on Sep 13

Training in progress, step 300

4151291
verified

BraylonDash commited on Sep 13

Training in progress, step 280

5fd9832
verified

BraylonDash commited on Sep 13

Training in progress, step 260

facad11
verified

BraylonDash commited on Sep 13

Training in progress, step 240

5035520
verified

BraylonDash commited on Sep 13

Training in progress, step 220

737a833
verified

BraylonDash commited on Sep 13

Training in progress, step 200

e9e2d5f
verified

BraylonDash commited on Sep 13

Training in progress, step 180

173af70
verified

BraylonDash commited on Sep 13

Training in progress, step 160

317c16a
verified

BraylonDash commited on Sep 13

Training in progress, step 140

b760195
verified

BraylonDash commited on Sep 13

Training in progress, step 80

08ec1b3
verified

BraylonDash commited on Sep 13

Training in progress, step 40

f21dd9b
verified

BraylonDash commited on Sep 13

initial commit

64011ba
verified

BraylonDash commited on Sep 12