Theo

Theo-10M · Chat

Menor que um app de celular. Consegue falar sobre a Bíblia.
Smaller than a phone app. Can talk about the Bible.


Sobre este modelo

Theo-10M-Chat é a versão conversacional do menor modelo da série — 7,4M de parâmetros, ajustado em ~19.000 exemplos de diálogo teológico via SFT (Supervised Fine-Tuning).

O resultado é surpreendente para o tamanho: o modelo entende o formato de conversa, mantém foco temático bíblico e responde de forma coerente em português. Não é perfeito — e nem deveria ser. Ele demonstra que é possível construir um assistente especializado extremamente leve, sem APIs externas, sem custo de inferência em nuvem.

Roda em CPU. Em tempo real. Com menos de 30 MB de peso.

🔗 Versão base (CPT): plvictor/Theo-10M-PTBR-Base


Para que serve?

  • Ambientes com recursos mínimos — CPU, edge, microcontroladores com inferência otimizada
  • Protótipos de chatbot cristão leve — resposta rápida, baixo custo
  • Estudo de SFT em modelos pequenos — como o fine-tuning transforma um modelo base
  • Comparação de qualidade — baseline para medir o ganho dos modelos maiores

Arquitetura e Treinamento

Parâmetro Valor
Parâmetros reais 7,4M
Camadas 4 · d_model=256 · FFN=1.024
Contexto máximo 512 tokens
Vocabulário 16.000 tokens (BPE próprio)
SFT examples ~19.000 pares de conversação teológica
GPU NVIDIA L40S 48 GB (RunPod)
SFT gerado com Qwen 35B como modelo professor

Como usar

git lfs install
git clone https://huggingface.co/plvictor/Theo-10M-Chat
cd Theo-10M-Chat
pip install -r requirements.txt

python chat.py
import torch
from config import get_config
from src.model import BabelTransformer

cfg   = get_config("babel_10M")
model = BabelTransformer(cfg)
ckpt  = torch.load("theo-10m-chat.pt", map_location="cpu", weights_only=False)
model.load_state_dict(ckpt["model_state_dict"], strict=False)
model.eval()

Limitações

  • Qualidade inferior aos modelos maiores da série — esperado e intencional
  • Janela de contexto de 512 tokens limita conversas longas
  • Pode perder coerência em turnos múltiplos
  • Não passou por RLHF ou filtragem de segurança

Autor

Paulo Victor Souza · plvictor.com · huggingface.co/plvictor

"No princípio era o Verbo." — João 1:1

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support