GGUF Inference API
llama-cpp-python
/docs