ondevicellm
/

tinyllama_moe_dpo_ultrachat_v2_epochs5

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

tinyllama_moe_dpo_ultrachat_v2_epochs5 / runs

1 contributor

History: 44 commits

hushell's picture

Model save

9ca1811 verified 8 months ago