ondevicellm
/

tinyllama_moe_dpo_ultrachat_v2_epochs3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

tinyllama_moe_dpo_ultrachat_v2_epochs3 / trainer_state.json

Commit History

Model save

b5a6361
verified

hushell commited on Jan 23