README.md · b4rtaz/Llama-3-8B-Q40-Distributed-Llama at 81e048e63d51f11757900a3c1dffba450d4d497e

metadata

license: llama3

This is converted Llama 3 8B model to Distributed Llama format. The model is quantized to Q40.

🚀 How to Run?

⏬ Download this repository.
⏬ Download Distributed Llama repository.
🔨 Build Distributed Llama:

make dllama

🚀 Run Distributed Llama:

./dllama inference --prompt "Hello world" --model dllama_model_meta-llama-3-8b_q40.m --tokenizer dllama_tokenizer_llama3.t --buffer-float-type q80 --nthreads 4

🎩 License

Llama 3 Community License