GGUF Inference API

llama-cpp-python