Spaces:

rrg92
/

sqlserver

Sleeping

App Files Files Community

sqlserver / app.py

rrg92

Adjusts

66e6717 about 2 months ago

raw

history blame contribute delete

3.3 kB

	import gradio as gr
	from fastapi import FastAPI, Request
	import uvicorn
	from sentence_transformers import SentenceTransformer
	from sentence_transformers.util import cos_sim
	from sentence_transformers.quantization import quantize_embeddings
	import spaces
	from gradio_client import Client
	import json
	import os


	app = FastAPI()



	@app.post("/v1/embeddings")
	async def openai_embeddings(request: Request):
	body = await request.json();
	token = request.headers.get("authorization");
	apiName = body.get("ApiName");

	print(body);

	BearerToken = None;
	if not token is None:
	parts = token.split(' ');
	BearerToken = parts[1];
	print("Using token...");

	SpacePath = body['model']

	print("Creating client...");
	SpaceClient = Client(SpacePath, hf_token = BearerToken)


	if not apiName:
	apiName = "/embed"

	text = body['input'];

	result = SpaceClient.predict(
	text=text,
	api_name=apiName
	)
	embeddings = json.loads(result);


	return {
	'object': "list"
	,'data': [{
	'object': "embeddings"
	,'embedding': embeddings
	,'index':0
	}]
	,'model': SpacePath
	,'usage':{
	'prompt_tokens': 0
	,'total_tokens': 0
	}
	}

	SpaceHost = os.environ.get("SPACE_HOST");

	if not SpaceHost:
	SpaceHost = "localhost"


	with gr.Blocks() as demo:
	gr.Markdown(f"""
	This space allow you connect SQL Server 2025 with Hugging Face to generate embeddings!
	First, create a ZeroGPU Space that export an endpoint called embed.
	That endpoint must accept a parameter called text.
	Then, create the external model using T-SQL:

	```sql
	CREATE EXTERNAL MODEL HuggingFace
	WITH (
	LOCATION = 'https://{SpaceHost}/v1/embeddings',
	API_FORMAT = 'OpenAI',
	MODEL_TYPE = EMBEDDINGS,
	MODEL = 'user/space'
	);
	```

	If you prefer, just type the space name into field bellow and we generate the right T-SQL command for you!


	""")

	SpaceName = gr.Textbox(label="Space", submit_btn=True)
	EndpointName = gr.Textbox(value="/embed", label = "EndpointName");
	tsqlCommand = gr.Textbox(lines=5);


	def UpdateTsql(space):
	return f"""
	CREATE EXTERNAL MODEL HuggingFace
	WITH (
	LOCATION = 'https://{SpaceHost}/v1/embeddings',
	API_FORMAT = 'OpenAI',
	MODEL_TYPE = EMBEDDINGS,
	MODEL = '{space}'
	)
	"""


	SpaceName.submit(UpdateTsql, [SpaceName], [tsqlCommand])





	## hack para funcionar com ZeroGPU nesse mesmo space
	#print("Demo run...");
	#(app2,url,other) = demo.launch(prevent_thread_lock=True, server_name=None, server_port=8000);
	# demo.close

	print("Mounting app...");
	GradioApp = gr.mount_gradio_app(app, demo, path="", ssr_mode=False);


	if __name__ == '__main__':
	print("Running uviconr...");
	uvicorn.run(GradioApp, host="0.0.0.0", port=7860)