Aviso de legado: este é o adapter da primeira iteração do Caramelo (3.4.1, geração Gemma 3), mantido público como registro do projeto. A versão em produção é o Caramelo 4.4.1 (Gemma 4 E4B).

Caramelo 3.4.1 (adapter LoRA v1)

Adapter LoRA da primeira iteração do Caramelo, o projeto de fine-tune na voz de escrita de Guilherme Favaron sobre modelos abertos. Base: google/gemma-3-4b-it, QLoRA 4-bit (r=16, alpha=32, dropout 0.05, módulos de atenção e MLP).

Esta iteração foi treinada direto nos artigos crus da newsletter IA Aplicada e regrediu em avaliação cega contra o próprio base: o modelo aprendia o formato de artigo em vez de responder a pergunta. A iteração seguinte (3.4.2) trocou os artigos crus por 414 pares de correção de estilo, o guifav/caramelo-dataset, e resolveu o problema. A história completa está no relatório técnico.

Onde está a versão atual

Segurança e licença

A camada de segurança do Caramelo em produção é aplicada server-side pelo gateway em ia-caramelo.com e não está embutida nestes pesos. Não use sem moderação própria. O adapter herda os termos de uso do Gemma (Google), incluindo a política de uso proibido.

Créditos

Desenvolvido, treinado e mantido por Guilherme Favaronguifav.github.io · guilhermefavaron.com.br.

Downloads last month
41
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for guifav/caramelo-lora-adapter

Adapter
(397)
this model

Space using guifav/caramelo-lora-adapter 1