socialfoundations
/

roberta-large-pile-lr2e-5-bs16-8gpu-1700000

Inference Endpoints

Model card Files Files and versions Community

roberta-large-pile-lr2e-5-bs16-8gpu-1700000 / README.md

mrtzh's picture

Upload 15 files

f2ffdac over 1 year ago

|

215 Bytes

Standard roberta-large model fine-tuned for one pass over the entire Pile dataset.

See Test-time training on nearest neighbors for large language models for details.