neuralmagic
/

zephyr-7b-beta-marlin

Text Generation

Inference Endpoints

text-generation-inference

4-bit precision

Model card Files Files and versions Community

zephyr-7b-beta-marlin / quantization

1 contributor

History: 3 commits

robertgshaw2's picture

Update quantization/apply_gptq_save_marlin.py

a037bbe verified 4 months ago