ondevicellm
/

tinyllama_moe_dpo_ultrachat_v2_epochs5

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

tinyllama_moe_dpo_ultrachat_v2_epochs5 / runs /Jan22_09-28-36_main1

Commit History

Training in progress, step 3300

9dc922a
verified

hushell commited on Jan 22