wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / runs /Dec06_23-31-48_6f40f359a06f /events.out.tfevents.1733527932.6f40f359a06f.1124.4

Commit History

Training in progress, step 6

a5909be
verified

wanyuhe499 commited on 19 days ago