ondevicellm
/

tinyllama_moe_dpo_ultrachat_v2_epochs5

Text Generation

alignment-handbook

Generated from Trainer

Inference Endpoints

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

tinyllama_moe_dpo_ultrachat_v2_epochs5 / runs /Jan22_09-28-36_main1

Commit History

Model save

9ca1811
verified

hushell commited on Jan 22

Training in progress, step 4700

1493208
verified

hushell commited on Jan 22

Training in progress, step 4600

3aef2c7
verified

hushell commited on Jan 22

Training in progress, step 4500

3a981ed
verified

hushell commited on Jan 22

Training in progress, step 4300

5459725
verified

hushell commited on Jan 22

Training in progress, step 4200

d382e21
verified

hushell commited on Jan 22

Training in progress, step 4100

576fbb5
verified

hushell commited on Jan 22

Training in progress, step 4000

fc7a6ad
verified

hushell commited on Jan 22

Training in progress, step 3900

f6df1ef
verified

hushell commited on Jan 22

Training in progress, step 3800

de3fff3
verified

hushell commited on Jan 22

Training in progress, step 3700

aa1e600
verified

hushell commited on Jan 22

Training in progress, step 3600

e03f7bf
verified

hushell commited on Jan 22

Training in progress, step 3500

8208efd
verified

hushell commited on Jan 22

Training in progress, step 3400

1a2446c
verified

hushell commited on Jan 22

Training in progress, step 3300

9dc922a
verified

hushell commited on Jan 22