neuralmagic
/

Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16

Text Generation

compressed-tensors

Model card Files Files and versions Community

Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16 / README.md

Commit History

Update README.md

0c2a256
verified

nm-research commited on Dec 19, 2024

Create README.md

0904fe5
verified

alexmarques commited on Nov 21, 2024