DUAL-GPO
/

phi-2-dpo-chatml-lora-40k-60k-i2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-chatml-lora-40k-60k-i2 / adapter_model.safetensors

Commit History

Model save

7d7328f
verified

BraylonDash commited on Sep 11

Training in progress, step 600

ef568a0
verified

BraylonDash commited on Sep 11

Training in progress, step 400

2cad568
verified

BraylonDash commited on Sep 11

Training in progress, step 300

6c537bf
verified

BraylonDash commited on Sep 11

Training in progress, step 200

84ebfe2
verified

BraylonDash commited on Sep 11

Training in progress, step 100

ddf180c
verified

BraylonDash commited on Sep 11