neuralmagic
/

Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16

Text Generation

compressed-tensors

Model card Files Files and versions Community

Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16 / model.safetensors

Commit History

Upload folder using huggingface_hub

c3699b8
verified

alexmarques commited on 5 days ago