metadata
tasks:
- text2sql
model-type:
- glm
domain:
- nlp
frameworks:
- pytorch
backbone:
- transformer
containers:
- >-
registry-vpc.cn-shanghai.aliyuncs.com/cloud-dsw/pytorch:1.8-cpu-py36-ubuntu18.04
- >-
registry-vpc.cn-shanghai.aliyuncs.com/cloud-dsw/tensorflow:1.12-cpu-py36-ubuntu18.04
customized-quickstart: false
finetune-support: false
license: apache-2.0
language:
- en
- fr
- cn
tags:
- transformer
pre-train: false
train:
- spider dataset
- bird dataset
sql_codellama 介绍
SQL-Codellama是一个用于text2SQL的模型。
模型底座
它是基于codellama模型构建的,该模型通过使用qlora进行训练。
训练数据
训练数据包含了spider、starcode等数据集。这个模型的目标是将自然语言查询转换为SQL查询。
功能
Text to SQL( 以下简称Text2SQL),是将自然语言文本(Text)转换成结构化查询语言SQL的过程,属于自然语言处理-语义分析(Semantic Parsing)领域中的子任务。 它的目的可以简单概括为:“打破人与结构化数据之间的壁垒”,即普通用户可以通过自然语言描述完成复杂数据库的查询工作,得到想要的结果。 它通过学习语法、语义和查询意图来理解用户的问题,并根据对应的数据库结构生成相应的SQL查询语句。SQL-Codellama的训练过程经过了大量的数据预处理、特征提取和模型训练,以提高其准确性和性能。 它可以应用于各种领域,如数据分析、数据库查询优化等。SQL-Codellama的设计和训练过程是为了使其能够处理复杂的查询,并产生高质量的SQL查询结果。它的目标是为用户提供准确、高效的文本到SQL转换,从而帮助用户更轻松地进行数据库查询和数据分析。
git clone https://www.modelscope.cn/tomatoModelScope/sql_codellama.git