Does this model use the same format as openchat 3.5?

by tarruda - opened Dec 14, 2023

Dec 14, 2023

I downloaded the Q6_K GGUF version and running on llama.cpp python API server(I'm using the same format as openchat 3.5), seems to have has a strange behavior at the end of a response:

gregmeldrum

Dec 14, 2023

•

edited Dec 14, 2023

Seeing the same thing with llama.cpp (not python) and the same GGUF:
Therefore, Jane is faster than Rahul.abbabbababbabbbababbabbbababbabbababbabababbabababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbababbab