Mangaba AI · Nordeste — Modelo Fine-tuned

Mangaba-AI-Nordeste-4B — assistente de IA brasileira especializada na plataforma Mangaba AI e em empresas do Nordeste do Brasil.

🥭 Nome do modelo


Nome	`Mangaba-AI-Nordeste-4B`
Criador	Prof. Dheiver Santos · mangaba.ia.br
Idioma	Português do Brasil (PT-BR)
Especialidade	Plataforma Mangaba AI + empresas/economia do Nordeste

🧬 De onde derivou (procedência)

Este modelo é um fine-tuning DoRA derivado de uma cadeia de modelos abertos:

Qwen3-4B-Instruct-2507              (modelo-base original · Alibaba Qwen, Apache-2.0)
        │  quantização 4-bit + conversão MLX
        ▼
mlx-community/Qwen3-4B-Instruct-2507-4bit   (base efetiva usada no treino)
        │  fine-tuning DoRA (rank 16, 12 camadas) + persona Mangaba
        ▼
Mangaba-AI-Nordeste-4B              (este modelo)

Modelo-base: Qwen/Qwen3-4B-Instruct-2507 — Apache-2.0
Base quantizada usada: mlx-community/Qwen3-4B-Instruct-2507-4bit
Técnica de adaptação: DoRA (Weight-Decomposed Low-Rank Adaptation)
Runtime: MLX (GPU do Apple Silicon)
Fontes dos dados:
- Conteúdo institucional de mangaba.ia.br (produtos, modelos de negócio, diferenciais)
- Conhecimento sobre empresas do Nordeste (CE, PE, BA, PB), polos industriais, energia renovável e agronegócio

Por que não GLM-5.1? O zai-org/GLM-5.1 tem ~753B de parâmetros e não roda num Mac de 16 GB nem para inferência. O Qwen3-4B é o equivalente atual (jun/2026) que treina de verdade localmente.

⚡ Uso direto do Hugging Face

pip install mlx-lm huggingface_hub
huggingface-cli download DHEIVER/Mangaba-AI-Nordeste-4B --local-dir Mangaba-AI-Nordeste-4B

python -m mlx_lm generate \
  --model mlx-community/Qwen3-4B-Instruct-2507-4bit \
  --adapter-path Mangaba-AI-Nordeste-4B/adapter \
  --system-prompt "Você é a Mangaba AI, assistente de inteligência artificial brasileira. Você conhece a plataforma Mangaba AI (mangaba.ia.br) e também empresas e a economia do Nordeste do Brasil." \
  --prompt "O que é o Mangaba Chat?"

🚀 Uso (reproduzir o treino)

cd ~/Downloads/Projetos/finetuning-mlx

bash setup.sh                                   # 1. ambiente (uma vez)
./run.sh train                                  # 2. treinar DoRA
./run.sh chat "Quem é você?"                    # 3. conversar
./run.sh chat "O que é o Mangaba Chat?"
./run.sh chat "Onde fica a Grendene?"
./run.sh fuse                                   # 4. gera ./Mangaba-AI-Nordeste-4B

🎯 O que o modelo sabe

Plataforma Mangaba AI (de mangaba.ia.br): Mangaba Chat, Pixel, Voice, Router, Agent, Edge AI, IoT, Core e Runtime; modelos de negócio SaaS / White Label / Framework / End-to-End; diferenciais de soberania de dados e deploy on-premises.

Empresas do Nordeste: M. Dias Branco, Grendene, Hapvida, J. Macêdo, Esmaltec, Ypióca, Grupo Edson Queiroz, Solar Coca-Cola (CE); Acumuladores Moura, Grupo João Santos (PE); Braskem/Camaçari, Bahiagás (BA); Grupo São Braz (PB); polos de Suape, Pecém, Camaçari, confecções do Agreste; energia eólica e fruticultura do Vale do São Francisco.

📈 Benchmarks

Todos os números abaixo foram medidos durante o treino e avaliação deste modelo.

Acurácia factual: base vs fine-tuned (10 perguntas)

O fine-tuning triplicou os acertos (2 → 6) e reduziu os erros pela metade (7 → 3).

Evolução da val loss por configuração

A consistência do system prompt (não a técnica) foi o maior salto: 0.87 → 0.528.

Curva de val loss — execução final

Mínimo no iter 350 (0.453); por isso o adapter usa esse checkpoint, não o final.

Por que Qwen3-4B como base

Único modelo que treina com folga nos 16 GB do MacBook Air M5. GLM-5.1 (753B) precisaria de ~1,5 TB.

Ressalva honesta: val loss menor mede ajuste ao dataset, não acurácia genérica. O modelo ainda erra alguns fatos discriminativos do Nordeste (ex: Acumuladores Moura, Melissa↔Grendene) por diluição de dados — corrigível com mais exemplos de reforço.

🧪 Detalhes técnicos

Parâmetro	Valor
Técnica	DoRA · rank 16 · 12 camadas
Config	`dora_config.yaml`
Dataset	110 exemplos (`data/train.jsonl`), formato chat com `system`
Seleção de checkpoint	menor val loss (≈0.53), não o final — evita overfitting
Persona	system prompt Mangaba em todos os exemplos
Adapter oficial	`adapters_dora_best/`

🎨 Identidade visual

Token	Valor
Primário	`#F97518` (laranja mangaba)
Texto	`#402B22` (marrom-café)
Fundo	`#FFF8F5` (creme)
Fonte	Open Sans

📁 Estrutura

finetuning-mlx/
├── assets/brand-logo.svg     · logo Mangaba AI
├── data/                     · train.jsonl + valid.jsonl (formato chat)
├── dora_config.yaml          · configuração DoRA
├── setup.sh                  · cria venv + instala mlx-lm
├── run.sh                    · train | chat | fuse
├── adapters_dora_best/       · melhor checkpoint (adapter oficial)
└── Mangaba-AI-Nordeste-4B/   · modelo standalone (após ./run.sh fuse)

⚖️ Licença e atribuição

Modelo-base Qwen3-4B-Instruct-2507 sob Apache-2.0 (Alibaba Qwen). Este fine-tuning herda a licença do modelo-base. Marca, identidade visual e dados institucionais © Mangaba AI — mangaba.ia.br.

_{🥭 Mangaba-AI-Nordeste-4B · derivado de Qwen3-4B-Instruct-2507 via DoRA · Prof. Dheiver Santos · mangaba.ia.br}

Downloads last month: -; Downloads are not tracked for this model. How to track

MLX

Hardware compatibility

Quantized

Model tree for DHEIVER/Mangaba-AI-Nordeste-4B

Base model

Qwen/Qwen3-4B-Instruct-2507

Adapter

(5570)

this model