neuralmagic
/

Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16

Text Generation

compressed-tensors

Model card Files Files and versions Community

Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16

1 contributor

History: 3 commits

alexmarques's picture

Create README.md

0904fe5 verified 4 days ago