nm-testing
/

SparseLlama-3-8B-pruned_50.2of4-FP8

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

SparseLlama-3-8B-pruned_50.2of4-FP8

2 contributors

History: 8 commits

mgoin's picture

Update README.md

75cbe95 verified 5 months ago