Infinirc
/

Infinirc-Llama3-8B-4bit-AWQ-GEMM-Beta

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Infinirc-Llama3-8B-4bit-AWQ-GEMM-Beta

1 contributor

History: 3 commits

RickyChen-Infinirc's picture

RickyChen-Infinirc

Update README.md

ba9d28a verified 12 days ago