HuggingFaceFW/fineweb
Viewer • Updated • 52.5B • 975k • 2.82k
MicroLM2-1M é um modelo de linguagem ultrapequeno (~1M parâmetros) treinado do zero com foco em inglês e português.
Treinado em aproximadamente 4.5 bilhões de tokens usando:
por_Latn)from transformers import AutoTokenizer, LlamaForCausalLM
tokenizer = AutoTokenizer.from_pretrained(
"CromIA/MicroLM2-1M"
)
model = LlamaForCausalLM.from_pretrained(
"CromIA/MicroLM2-1M"
)
Projeto experimental voltado para: