dataset - a ByRookie Collection

ByRookie 's Collections

kd

pretrain data selectection

llm length control

dataset

dataset

updated Oct 7, 2024

Revisit Large-Scale Image-Caption Data in Pre-training Multimodal Foundation Models

Paper • 2410.02740 • Published Oct 3, 2024 • 52