SLM-GigaVerbo — Base (14M parâmetros)

Modelo de linguagem causal treinado do zero em português brasileiro, parte da série "Criando seu próprio SLM do Zero" por Álvaro Brito.

Uso

ollama run hf.co/alvarobrito/slm-gigaverbo-gguf

Arquitetura

Parâmetro Valor
Parâmetros 14M
d_model 256
Layers 8
Heads 4
KV heads 1
FFN (SwiGLU) 768
Contexto 512 tokens
Vocab 16000 (BPE PT-BR)

Limitações

Modelo educacional — output coerente em PT-BR mas não comparável a modelos de produção.

Downloads last month
129
Safetensors
Model size
14.2M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support