LangToSQL / README.es.md
Komma-LuisMiSanVe's picture
Update files
c4225a4
metadata
language:
  - en
thumbnail: >-
  https://raw.githubusercontent.com/LuisMiSanVe/LuisMiSanVe/refs/heads/main/Resources/LangToSQL/LangToSQLLLM_banner.png
tags:
  - sql
  - text-to-sql
  - llm
  - fine-tuning
  - gguf
license: apache-2.0
datasets:
  - xlangai/spider
base_model: Qwen/Qwen2.5-Coder-1.5B-Instruct

Ver en ingles/See in english

LangToSQL LLM Banner

🤖 Modelo de IA para sentencias PostgreSQL

image image image Python PyTorch NumPy HuggingFace

Dale un vistazo a las otras versiones del programa:

El modelo de IA ha sido entrenado para convertir lenguaje natural a sentencias de PostgreSQL.

📝 Explicación de Tecnología

El modelo usa Gwen Coder de base y refinado con los datasets de Spider.

El dataset en archivo JSON contiene train_spider.json de Spider, ya que es el dataset principal.

El modelo se ha exportado a GGUF con llama.cpp para que puedas usarlo en programas como LM Studio.

🛠️ Instalación

Para ejecutar el script de entrenamiento por tu cuenta, primero necesitas instalar Python y ejecuta este comando:

pip install transformers datasets peft accelerate bitsandbytes trl==1.0.0

Dependiendo en la versión, es posible que necesites usar este en su lugar:

py -m pip install transformers datasets peft accelerate bitsandbytes trl==1.0.0

Asegurate que la libreria TRL está en la versión 1.0.0, ya que es la única version compatible con el script de entrenamiento.

📂 Archivos

Este repositorio incluye los archivos del modelo LLM entrenado, su script de entrenamiento, el dataset para entrenar y un script para probar el modelo .safetensors.

Puedes descargar el GGUF final desde los Lanzamientos.

🚀 Lanzamientos

Una versión será lanzada solo cuando se cumplan los siguientes puntos:
Nuevas funciones importantes y arreglos de fallos criticos causarán la salida inmediata de una nueva versión, mientras que otros cambios/arreglos menores deberán esperar una semana desde que se incluyeron en el repositorio antes de ser incluidos en la nueva versión, para que otros posibles cambios puedan ser añadidos tambien.

Estos posibles nuevos cambios no alargarán la espera de la salida de la nueva versión a más de una semana.

El número de la versión seguirá este formato:
[Añadido Importante].[Añadido Menor].[Arreglos de Errores]

💻 Tecnologías usadas