nm-testing
/

SparseLlama-2-7b-dolphin-open_platypus-pruned_50.2of4-quantized.w4a16

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

SparseLlama-2-7b-dolphin-open_platypus-pruned_50.2of4-quantized.w4a16

2 contributors

History: 2 commits

Eldar Kurtic

Initial commit

ad0a8fd 3 months ago