fine-tuning

#2
by rhaymison - opened

Estou trabalhando em um projeto envolvendo aprendizado de máquina e gostaria de solicitar sua assistência. Tenho uma coleção de aproximadamente 1000 artigos científicos e estou interessado em realizar um processo de fine-tuning em um modelo de linguagem para melhor atender às necessidades específicas do meu projeto.

Seria possível fornecer uma explicação mais detalhada sobre como posso efetuar o fine-tuning de um modelo de linguagem utilizando esses artigos? Além disso, se possível, gostaria de solicitar um exemplo de código que possa seguir como referência. Este exemplo seria extremamente útil para entender melhor as etapas e os requisitos técnicos envolvidos no processo.

Agradeço antecipadamente pelo seu tempo e assistência.

Atenciosamente,

Rhaymison Cristian.
Email para contato: rhaymioncristian@gmail.com

Recogna NLP org
edited Jan 10

Olá @rhaymison ,

Agradecemos pelo seu contato e interesse em utilizar o Bode para o seu projeto.

Em relação ao fine-tuning que aplicamos para desenvolver o Bode, optamos por utilizar a técnica conhecida como Low Rank Adaptation (LoRA), uma abordagem que simplifica a adaptação de LLMs pré-treinados para novas tarefas. A LoRA propõe congelar os pesos do modelo pré-treinado e introduzir camadas treináveis (matrizes de decomposição de classificação) em cada bloco de transformadores. Essa estratégia reduz significativamente o número de parâmetros treináveis e os requisitos de memória da GPU, uma vez que os gradientes não precisam ser computados para a maioria dos pesos do modelo.

Para obter orientações mais detalhadas sobre o processo de fine-tuning, recomendamos a leitura de nosso artigo, disponível no seguinte link: https://arxiv.org/abs/2401.02909. A sugestão do @luisrguerra também é muito boa!

Caso surjam dúvidas ou se precisar de mais esclarecimentos após a leitura do artigo, ficamos à disposição para fornecer o suporte necessário.

Agradecemos imensamente por suas participações. Esperamos que o Bode seja útil em suas pesquisas ou trabalhos. Fiquem atentos, pois em breve lançaremos novas versões do Bode!

Atenciosamente,

Recogna NLP.

Sign up or log in to comment