metrics on 1024 context:

metrics on 252 context:

metrics on 378 context:

metrics on 504 context:

Dependence of the cross entropy loss on the length of the context for prediction

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

irodkin
/

gpt2-wiki2

Dataset used to train irodkin/gpt2-wiki2