agier9/gte-Qwen1.5-7B-instruct-Q5_K_M-GGUF

This model was converted to GGUF format from Alibaba-NLP/gte-Qwen1.5-7B-instruct using llama.cpp via the ggml.ai's GGUF-my-repo space. Refer to the original model card for more details on the model.

Use with llama.cpp

Install llama.cpp through brew.

brew install ggerganov/ggerganov/llama.cpp

Invoke the llama.cpp server or the CLI. CLI:

llama-cli --hf-repo agier9/gte-Qwen1.5-7B-instruct-Q5_K_M-GGUF --model gte-qwen1.5-7b-instruct-q5_k_m.gguf -p "The meaning to life and the universe is"

Server:

llama-server --hf-repo agier9/gte-Qwen1.5-7B-instruct-Q5_K_M-GGUF --model gte-qwen1.5-7b-instruct-q5_k_m.gguf -c 2048

Note: You can also use this checkpoint directly through the usage steps listed in the Llama.cpp repo as well.

git clone https://github.com/ggerganov/llama.cpp && \
cd llama.cpp && \
make && \
./main -m gte-qwen1.5-7b-instruct-q5_k_m.gguf -n 128

Spaces using agier9/gte-Qwen1.5-7B-instruct-Q5_K_M-GGUF 2

Evaluation results

accuracy on MTEB AmazonCounterfactualClassification (en)
test set self-reported

83.164
ap on MTEB AmazonCounterfactualClassification (en)
test set self-reported

49.377
f1 on MTEB AmazonCounterfactualClassification (en)
test set self-reported

77.530
accuracy on MTEB AmazonPolarityClassification
test set self-reported

96.696
ap on MTEB AmazonPolarityClassification
test set self-reported

94.909
f1 on MTEB AmazonPolarityClassification
test set self-reported

96.695
accuracy on MTEB AmazonReviewsClassification (en)
test set self-reported

62.168
f1 on MTEB AmazonReviewsClassification (en)
test set self-reported

60.411
map_at_1 on MTEB ArguAna
test set self-reported

36.415
map_at_10 on MTEB ArguAna
test set self-reported

53.505

View on Papers With Code