nm-testing
/

tinyllama-fp8-tensor-quant

Text Generation

text-generation-inference

Model card Files Files and versions

tinyllama-fp8-tensor-quant

1.5 GB

2 contributors

History: 4 commits

mgoin's picture

Updated compression_config to quantization_config

d7160a0 verified 12 months ago