DUAL-GPO
/

phi-2-dpo-chatml-lora-10k-30k-i1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-chatml-lora-10k-30k-i1

Commit History

Training in progress, step 500

7e35958
verified

BraylonDash commited on Sep 10, 2024

Training in progress, step 300

14323aa
verified

BraylonDash commited on Sep 10, 2024

Training in progress, step 100

abd609e
verified

BraylonDash commited on Sep 10, 2024

initial commit

2f1eab2
verified

BraylonDash commited on Sep 10, 2024