wanyuhe499
/

llm_judge_dpo_peft

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft / runs /Dec06_04-49-20_83b1d48b5f83 /events.out.tfevents.1733460561.83b1d48b5f83.1849.1

Commit History

End of training

d295f0e
verified

wanyuhe499 commited on 19 days ago