turboderp
/

granite-20b-code-instruct-exl2

Model card Files Files and versions

EXL2 quants of Granite-20B-Code-Instruct

pad_token_id has been changed in config.json to allow masking/batched inference to work.

2.50 bits per weight
3.00 bits per weight
3.50 bits per weight
4.00 bits per weight
4.50 bits per weight
5.00 bits per weight
6.00 bits per weight

measurement.json

Downloads last month: -; Downloads are not tracked for this model. How to track

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support