nm-testing
/

tinyllama-one-shot-w4a16-channel-compressed

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

tinyllama-one-shot-w4a16-channel-compressed

Commit History

Added quant_method to quantization_config

2591073
verified

mgoin commited on Oct 9

Updated compression_config to quantization_config

d56229c
verified

mgoin commited on Oct 9

Upload folder using huggingface_hub

f5bce8e
verified

sadkins65 commited on May 15

Upload folder using huggingface_hub

7e06f55
verified

sadkins65 commited on May 9

Upload folder using huggingface_hub

73ebc9b
verified

sadkins65 commited on May 9

initial commit

a9994db
verified

sadkins65 commited on May 9