Mangaba AI

Mangaba AI · Nordeste — Modelo Fine-tuned

Mangaba AI Modelo Técnica Runtime Licença base

Mangaba-AI-Nordeste-4B — assistente de IA brasileira especializada na plataforma Mangaba AI e em empresas do Nordeste do Brasil.


🥭 Nome do modelo

Nome Mangaba-AI-Nordeste-4B
Criador Prof. Dheiver Santos · mangaba.ia.br
Idioma Português do Brasil (PT-BR)
Especialidade Plataforma Mangaba AI + empresas/economia do Nordeste

🧬 De onde derivou (procedência)

Este modelo é um fine-tuning DoRA derivado de uma cadeia de modelos abertos:

Qwen3-4B-Instruct-2507              (modelo-base original · Alibaba Qwen, Apache-2.0)
        │  quantização 4-bit + conversão MLX
        ▼
mlx-community/Qwen3-4B-Instruct-2507-4bit   (base efetiva usada no treino)
        │  fine-tuning DoRA (rank 16, 12 camadas) + persona Mangaba
        ▼
Mangaba-AI-Nordeste-4B              (este modelo)
  • Modelo-base: Qwen/Qwen3-4B-Instruct-2507 — Apache-2.0
  • Base quantizada usada: mlx-community/Qwen3-4B-Instruct-2507-4bit
  • Técnica de adaptação: DoRA (Weight-Decomposed Low-Rank Adaptation)
  • Runtime: MLX (GPU do Apple Silicon)
  • Fontes dos dados:
    • Conteúdo institucional de mangaba.ia.br (produtos, modelos de negócio, diferenciais)
    • Conhecimento sobre empresas do Nordeste (CE, PE, BA, PB), polos industriais, energia renovável e agronegócio

Por que não GLM-5.1? O zai-org/GLM-5.1 tem ~753B de parâmetros e não roda num Mac de 16 GB nem para inferência. O Qwen3-4B é o equivalente atual (jun/2026) que treina de verdade localmente.

⚡ Uso direto do Hugging Face

pip install mlx-lm huggingface_hub
huggingface-cli download DHEIVER/Mangaba-AI-Nordeste-4B --local-dir Mangaba-AI-Nordeste-4B

python -m mlx_lm generate \
  --model mlx-community/Qwen3-4B-Instruct-2507-4bit \
  --adapter-path Mangaba-AI-Nordeste-4B/adapter \
  --system-prompt "Você é a Mangaba AI, assistente de inteligência artificial brasileira. Você conhece a plataforma Mangaba AI (mangaba.ia.br) e também empresas e a economia do Nordeste do Brasil." \
  --prompt "O que é o Mangaba Chat?"

🚀 Uso (reproduzir o treino)

cd ~/Downloads/Projetos/finetuning-mlx

bash setup.sh                                   # 1. ambiente (uma vez)
./run.sh train                                  # 2. treinar DoRA
./run.sh chat "Quem é você?"                    # 3. conversar
./run.sh chat "O que é o Mangaba Chat?"
./run.sh chat "Onde fica a Grendene?"
./run.sh fuse                                   # 4. gera ./Mangaba-AI-Nordeste-4B

🎯 O que o modelo sabe

Plataforma Mangaba AI (de mangaba.ia.br): Mangaba Chat, Pixel, Voice, Router, Agent, Edge AI, IoT, Core e Runtime; modelos de negócio SaaS / White Label / Framework / End-to-End; diferenciais de soberania de dados e deploy on-premises.

Empresas do Nordeste: M. Dias Branco, Grendene, Hapvida, J. Macêdo, Esmaltec, Ypióca, Grupo Edson Queiroz, Solar Coca-Cola (CE); Acumuladores Moura, Grupo João Santos (PE); Braskem/Camaçari, Bahiagás (BA); Grupo São Braz (PB); polos de Suape, Pecém, Camaçari, confecções do Agreste; energia eólica e fruticultura do Vale do São Francisco.

📈 Benchmarks

Todos os números abaixo foram medidos durante o treino e avaliação deste modelo.

Acurácia factual: base vs fine-tuned (10 perguntas)

O fine-tuning triplicou os acertos (2 → 6) e reduziu os erros pela metade (7 → 3).

Acurácia vs base

Evolução da val loss por configuração

A consistência do system prompt (não a técnica) foi o maior salto: 0.87 → 0.528.

Val loss por configuração

Curva de val loss — execução final

Mínimo no iter 350 (0.453); por isso o adapter usa esse checkpoint, não o final.

Curva de val loss

Por que Qwen3-4B como base

Único modelo que treina com folga nos 16 GB do MacBook Air M5. GLM-5.1 (753B) precisaria de ~1,5 TB.

Modelos base vs 16 GB

Ressalva honesta: val loss menor mede ajuste ao dataset, não acurácia genérica. O modelo ainda erra alguns fatos discriminativos do Nordeste (ex: Acumuladores Moura, Melissa↔Grendene) por diluição de dados — corrigível com mais exemplos de reforço.

🧪 Detalhes técnicos

Parâmetro Valor
Técnica DoRA · rank 16 · 12 camadas
Config dora_config.yaml
Dataset 110 exemplos (data/train.jsonl), formato chat com system
Seleção de checkpoint menor val loss (≈0.53), não o final — evita overfitting
Persona system prompt Mangaba em todos os exemplos
Adapter oficial adapters_dora_best/

🎨 Identidade visual

Token Valor
Primário #F97518 (laranja mangaba)
Texto #402B22 (marrom-café)
Fundo #FFF8F5 (creme)
Fonte Open Sans

📁 Estrutura

finetuning-mlx/
├── assets/brand-logo.svg     · logo Mangaba AI
├── data/                     · train.jsonl + valid.jsonl (formato chat)
├── dora_config.yaml          · configuração DoRA
├── setup.sh                  · cria venv + instala mlx-lm
├── run.sh                    · train | chat | fuse
├── adapters_dora_best/       · melhor checkpoint (adapter oficial)
└── Mangaba-AI-Nordeste-4B/   · modelo standalone (após ./run.sh fuse)

⚖️ Licença e atribuição

Modelo-base Qwen3-4B-Instruct-2507 sob Apache-2.0 (Alibaba Qwen). Este fine-tuning herda a licença do modelo-base. Marca, identidade visual e dados institucionais © Mangaba AImangaba.ia.br.


🥭 Mangaba-AI-Nordeste-4B · derivado de Qwen3-4B-Instruct-2507 via DoRA · Prof. Dheiver Santos · mangaba.ia.br
Downloads last month

-

Downloads are not tracked for this model. How to track
MLX
Hardware compatibility
Log In to add your hardware

Quantized

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for DHEIVER/Mangaba-AI-Nordeste-4B

Adapter
(5570)
this model