Qwen2.5-0.5B — GGUF Q4_K_M · Saúde Coletiva Amazônia (sLLM offline)

Potencialidades dos Pequenos Modelos de Linguagem (sLLMs) como Assistentes Offline na Saúde Coletiva: Curadoria Informacional contra Assimetrias na Amazônia Isolada. (ENANCIB 2026 / GT 8 — Ciência da Informação)

📋 Resumo

sLLM (small LLM) em português para apoiar profissionais de saúde em comunidades isoladas da Amazônia, operando 100% offline com grounding (RAG) em um corpus oficial do SUS. A tese: a curadoria da informação — mais que o porte do modelo — determina a confiabilidade. Treinado em 1.000 diálogos clínicos sintéticos curados (pilares P3 Saúde Indígena e P5 Atenção Primária).

🧩 Este artefato — GGUF Q4_K_M (deploy smartphone)

GGUF quantizado Q4_K_M (~4 bits/peso, ~0.4 GB) derivado do fundido fp16 (admin-lima/qwen05b-saude-amazonia-merged) via llama.cpp. Voltado para inferência offline.

Como rodar (100% offline):

  • Desktop/servidor: llama.cpp (llama-cli -m <arquivo>.gguf) ou llama-cpp-python.
  • Smartphone: apps Chatterbox, LM Studio, Maid ou PocketPal — abra o .gguf.
./llama-cli -m qwen05b-saude-amazonia-gguf.Q4_K_M.gguf \
  --chat-template chatml  # Phi-3.5 / Qwen2.5: template system/user/assistant

Chat template: system / user / assistant (mesmo do Qwen2.5-0.5B).

📊 Resultados (conjunto hold-out, n=33)

Modelo Porte TRR FRR F1 Halluc.
Phi-3.5-mini (QLoRA) 3.8B 0.929 0.266 0.813 0.03
Qwen2.5-0.5B (LoRA) 500M 0.857 0.053 0.889 0.03

TRR — relevância da resposta · FRR — taxa de recusa · F1 — F1 de recusa (recusar o que está fora do escopo) · Halluc. — taxa de alucinação.

🔗 Artefatos relacionados

Artefato Repositório
Dataset (SFT) admin-lima/sllm-amazonia-saude-sft
Phi-3.5-mini — adapter admin-lima/phi35-saude-amazonia-lora
Phi-3.5-mini — fundido fp16 admin-lima/phi35-saude-amazonia-merged
Phi-3.5-mini — GGUF Q4_K_M admin-lima/phi35-saude-amazonia-gguf
Qwen2.5-0.5B — adapter admin-lima/qwen05b-saude-amazonia-lora
Qwen2.5-0.5B — fundido fp16 admin-lima/qwen05b-saude-amazonia-merged
✅ Qwen2.5-0.5B — GGUF Q4_K_M admin-lima/qwen05b-saude-amazonia-gguf

🛡️ Limitações e uso responsável

  • Não é dispositivo médico nem substitui avaliação profissional. Use como apoio à decisão.
  • Deve operar acoplado ao corpus RAG (pilares oficiais do SUS) para grounding.
  • Treinado em dados sintéticos em PT-BR com foco regional (Amazônia); pode ter lacunas.
  • Alucinação ≈ 3 % (não nula) — sempre verifique informações críticas.
  • Mantenha o modelo offline em ambientes sem conectividade; respeite a privacidade dos dados locais.

📜 Licença

Derivado de Qwen/Qwen2.5-0.5B-Instruct. Distribuído sob a licença do modelo base (apache-2.0). Dataset sintético próprio.

📚 Citação (preliminar)

@misc{sllm_amazonia_saude_2026,
  title  = {sLLMs Offline de Saúde Coletiva na Amazônia},
  author = {admin-lima},
  year   = {2026},
  note   = {ENANCIB 2026 / GT 8 — pré-print}
}
Downloads last month
41
GGUF
Model size
0.5B params
Architecture
qwen2
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for admin-lima/qwen05b-saude-amazonia-gguf

Quantized
(230)
this model