SLM-GigaVerbo-SFT (14M parâmetros)

Modelo base SLM-GigaVerbo com fine-tuning supervisionado no Alpaca PT-BR.

Uso

ollama run hf.co/alvarobrito/slm-gigaverbo-sft-gguf

Formato de prompt:

[INST] Sua pergunta [/INST]

Pipeline

  • Pré-treinamento: ~97M tokens GigaVerbo (24k steps, T4 × 2)
  • SFT: 500 steps Alpaca PT-BR (dominguesm/alpaca-data-pt-br)

Limitações

Modelo educacional. Output com estrutura de instrução mas conteúdo inconsistente — base com 14M parâmetros e dados limitados.

Downloads last month
39
Safetensors
Model size
14.2M params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Dataset used to train alvarobrito/slm-gigaverbo-sft