Instructions to use DHEIVER/Mangaba-AI-Nordeste-4B with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- MLX
How to use DHEIVER/Mangaba-AI-Nordeste-4B with MLX:
# Make sure mlx-lm is installed # pip install --upgrade mlx-lm # Generate text with mlx-lm from mlx_lm import load, generate model, tokenizer = load("DHEIVER/Mangaba-AI-Nordeste-4B") prompt = "Write a story about Einstein" messages = [{"role": "user", "content": prompt}] prompt = tokenizer.apply_chat_template( messages, add_generation_prompt=True ) text = generate(model, tokenizer, prompt=prompt, verbose=True) - Notebooks
- Google Colab
- Kaggle
- Local Apps Settings
- LM Studio
- MLX LM
How to use DHEIVER/Mangaba-AI-Nordeste-4B with MLX LM:
Generate or start a chat session
# Install MLX LM uv tool install mlx-lm # Interactive chat REPL mlx_lm.chat --model "DHEIVER/Mangaba-AI-Nordeste-4B"
Run an OpenAI-compatible server
# Install MLX LM uv tool install mlx-lm # Start the server mlx_lm.server --model "DHEIVER/Mangaba-AI-Nordeste-4B" # Calling the OpenAI-compatible server with curl curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "DHEIVER/Mangaba-AI-Nordeste-4B", "messages": [ {"role": "user", "content": "Hello"} ] }'
Mangaba AI · Nordeste — Modelo Fine-tuned
Mangaba-AI-Nordeste-4B — assistente de IA brasileira especializada na
plataforma Mangaba AI e em empresas do Nordeste do Brasil.
🥭 Nome do modelo
| Nome | Mangaba-AI-Nordeste-4B |
| Criador | Prof. Dheiver Santos · mangaba.ia.br |
| Idioma | Português do Brasil (PT-BR) |
| Especialidade | Plataforma Mangaba AI + empresas/economia do Nordeste |
🧬 De onde derivou (procedência)
Este modelo é um fine-tuning DoRA derivado de uma cadeia de modelos abertos:
Qwen3-4B-Instruct-2507 (modelo-base original · Alibaba Qwen, Apache-2.0)
│ quantização 4-bit + conversão MLX
▼
mlx-community/Qwen3-4B-Instruct-2507-4bit (base efetiva usada no treino)
│ fine-tuning DoRA (rank 16, 12 camadas) + persona Mangaba
▼
Mangaba-AI-Nordeste-4B (este modelo)
- Modelo-base:
Qwen/Qwen3-4B-Instruct-2507— Apache-2.0 - Base quantizada usada:
mlx-community/Qwen3-4B-Instruct-2507-4bit - Técnica de adaptação: DoRA (Weight-Decomposed Low-Rank Adaptation)
- Runtime: MLX (GPU do Apple Silicon)
- Fontes dos dados:
- Conteúdo institucional de mangaba.ia.br (produtos, modelos de negócio, diferenciais)
- Conhecimento sobre empresas do Nordeste (CE, PE, BA, PB), polos industriais, energia renovável e agronegócio
Por que não GLM-5.1? O
zai-org/GLM-5.1tem ~753B de parâmetros e não roda num Mac de 16 GB nem para inferência. O Qwen3-4B é o equivalente atual (jun/2026) que treina de verdade localmente.
⚡ Uso direto do Hugging Face
pip install mlx-lm huggingface_hub
huggingface-cli download DHEIVER/Mangaba-AI-Nordeste-4B --local-dir Mangaba-AI-Nordeste-4B
python -m mlx_lm generate \
--model mlx-community/Qwen3-4B-Instruct-2507-4bit \
--adapter-path Mangaba-AI-Nordeste-4B/adapter \
--system-prompt "Você é a Mangaba AI, assistente de inteligência artificial brasileira. Você conhece a plataforma Mangaba AI (mangaba.ia.br) e também empresas e a economia do Nordeste do Brasil." \
--prompt "O que é o Mangaba Chat?"
🚀 Uso (reproduzir o treino)
cd ~/Downloads/Projetos/finetuning-mlx
bash setup.sh # 1. ambiente (uma vez)
./run.sh train # 2. treinar DoRA
./run.sh chat "Quem é você?" # 3. conversar
./run.sh chat "O que é o Mangaba Chat?"
./run.sh chat "Onde fica a Grendene?"
./run.sh fuse # 4. gera ./Mangaba-AI-Nordeste-4B
🎯 O que o modelo sabe
Plataforma Mangaba AI (de mangaba.ia.br): Mangaba Chat, Pixel, Voice, Router, Agent, Edge AI, IoT, Core e Runtime; modelos de negócio SaaS / White Label / Framework / End-to-End; diferenciais de soberania de dados e deploy on-premises.
Empresas do Nordeste: M. Dias Branco, Grendene, Hapvida, J. Macêdo, Esmaltec, Ypióca, Grupo Edson Queiroz, Solar Coca-Cola (CE); Acumuladores Moura, Grupo João Santos (PE); Braskem/Camaçari, Bahiagás (BA); Grupo São Braz (PB); polos de Suape, Pecém, Camaçari, confecções do Agreste; energia eólica e fruticultura do Vale do São Francisco.
📈 Benchmarks
Todos os números abaixo foram medidos durante o treino e avaliação deste modelo.
Acurácia factual: base vs fine-tuned (10 perguntas)
O fine-tuning triplicou os acertos (2 → 6) e reduziu os erros pela metade (7 → 3).
Evolução da val loss por configuração
A consistência do system prompt (não a técnica) foi o maior salto: 0.87 → 0.528.
Curva de val loss — execução final
Mínimo no iter 350 (0.453); por isso o adapter usa esse checkpoint, não o final.
Por que Qwen3-4B como base
Único modelo que treina com folga nos 16 GB do MacBook Air M5. GLM-5.1 (753B) precisaria de ~1,5 TB.
Ressalva honesta: val loss menor mede ajuste ao dataset, não acurácia genérica. O modelo ainda erra alguns fatos discriminativos do Nordeste (ex: Acumuladores Moura, Melissa↔Grendene) por diluição de dados — corrigível com mais exemplos de reforço.
🧪 Detalhes técnicos
| Parâmetro | Valor |
|---|---|
| Técnica | DoRA · rank 16 · 12 camadas |
| Config | dora_config.yaml |
| Dataset | 110 exemplos (data/train.jsonl), formato chat com system |
| Seleção de checkpoint | menor val loss (≈0.53), não o final — evita overfitting |
| Persona | system prompt Mangaba em todos os exemplos |
| Adapter oficial | adapters_dora_best/ |
🎨 Identidade visual
| Token | Valor |
|---|---|
| Primário | #F97518 (laranja mangaba) |
| Texto | #402B22 (marrom-café) |
| Fundo | #FFF8F5 (creme) |
| Fonte | Open Sans |
📁 Estrutura
finetuning-mlx/
├── assets/brand-logo.svg · logo Mangaba AI
├── data/ · train.jsonl + valid.jsonl (formato chat)
├── dora_config.yaml · configuração DoRA
├── setup.sh · cria venv + instala mlx-lm
├── run.sh · train | chat | fuse
├── adapters_dora_best/ · melhor checkpoint (adapter oficial)
└── Mangaba-AI-Nordeste-4B/ · modelo standalone (após ./run.sh fuse)
⚖️ Licença e atribuição
Modelo-base Qwen3-4B-Instruct-2507 sob Apache-2.0 (Alibaba Qwen). Este
fine-tuning herda a licença do modelo-base. Marca, identidade visual e dados
institucionais © Mangaba AI — mangaba.ia.br.
Quantized
Model tree for DHEIVER/Mangaba-AI-Nordeste-4B
Base model
Qwen/Qwen3-4B-Instruct-2507


