Theo-25M · Chat
Onde as primeiras conversas reais aconteceram.
Where the first real conversations happened.
Sobre este modelo
Theo-25M-Chat é a versão conversacional do segundo modelo da série — 27,3M de parâmetros reais, ajustado em ~19.000 pares de diálogo teológico.
É aqui que a experiência começa a fazer sentido. O modelo mantém o fio de uma conversa sobre fé, responde perguntas sobre versículos com coerência, e já carrega traços da personalidade do Theo: caloroso, engajado, focado na Bíblia. Não é o modelo mais capaz da série, mas é um dos que melhor demonstra o que o SFT consegue fazer com uma base sólida: transformar geração de texto em diálogo real.
🔗 Versão base (CPT):
plvictor/Theo-25M-PTBR-Base
Demonstração de capacidade
Com 27,3M de parâmetros treinados do zero em português, este modelo consegue:
- Responder o que diz um versículo específico
- Explicar conceitos como graça, salvação, batismo em linguagem acessível
- Manter tom cristão evangélico consistente ao longo da conversa
- Fazer perguntas de volta e engajar o usuário
É um modelo honesto sobre suas limitações — e impressionante dentro delas.
Arquitetura e Treinamento
| Parâmetro | Valor |
|---|---|
| Parâmetros reais | 27,3M |
| Camadas | 6 · d_model=512 · FFN=2.048 |
| Contexto máximo | 512 tokens |
| Vocabulário | 16.000 tokens (BPE próprio) |
| SFT examples | ~19.000 pares de conversação teológica |
| GPU | NVIDIA L40S 48 GB (RunPod) |
| Custo estimado | < $6 |
Como usar
git lfs install
git clone https://huggingface.co/plvictor/Theo-25M-Chat
cd Theo-25M-Chat
pip install -r requirements.txt
python chat.py
import torch
from config import get_config
from src.model import BabelTransformer
cfg = get_config("babel_25M")
model = BabelTransformer(cfg)
ckpt = torch.load("theo-25m-chat.pt", map_location="cpu", weights_only=False)
model.load_state_dict(ckpt["model_state_dict"], strict=False)
model.eval()
Autor
Paulo Victor Souza · plvictor.com · huggingface.co/plvictor
"No princípio era o Verbo." — João 1:1