sandeepaffine
/

meta-llama-Llama-2-7b-chat-hf-8bit-lmhead-embedtoken-2M-v3-merged-test-4bit-ift

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

Model card Files Files and versions Community

meta-llama-Llama-2-7b-chat-hf-8bit-lmhead-embedtoken-2M-v3-merged-test-4bit-ift

1 contributor

History: 3 commits

sandeepaffine's picture

Upload tokenizer

8236e0f verified about 1 month ago