#!/bin/bash python -m vllm.entrypoints.openai.api_server --model neongeckocom/NeonLLM --max-model-len 8000 --port 5000 --api-key [...]