Modelo llama v2 7b, treinado em portugues via QLORA, bons resultados com a lingua. testado apenas em windos, cuda 1.2.1, imagino que pelo menos 4GB de ram na GPU é necessária devido a quantização 4bit.
Unable to determine this model's library. Check the
docs
.