nm-testing
/

Meta-Llama-3-70B-Instruct-W8A8-Dynamic-Per-Token

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3-70B-Instruct-W8A8-Dynamic-Per-Token

Commit History

Updated compression_config to quantization_config

5619128
verified

mgoin commited on Oct 9

Upload folder using huggingface_hub

f4ea0ee
verified

robertgshaw2 commited on Jul 23

initial commit

5246393
verified

robertgshaw2 commited on Jul 23