neuralmagic
/

Meta-Llama-3.1-70B-Instruct-quantized.w8a16

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-70B-Instruct-quantized.w8a16

Commit History

Updated compression_config to quantization_config

4a28f50
verified

mgoin commited on Oct 9

Update README.md

33c68d0
verified

alexmarques commited on Oct 1

Upload tokenizer.json with huggingface_hub

8e42fca
verified

alexmarques commited on Sep 30

Update README.md

65b86b1
verified

alexmarques commited on Sep 30

Upload tokenizer_config.json with huggingface_hub

cc2f1e3
verified

alexmarques commited on Sep 27

Update README.md

05f6525
verified

alexmarques commited on Aug 13

Update README.md

e8e0ea8
verified

alexmarques commited on Aug 7

Update README.md

422a385
verified

alexmarques commited on Jul 31

Update README.md

b6c9b9c
verified

alexmarques commited on Jul 31

Update README.md

c085fe9
verified

alexmarques commited on Jul 30

Update README.md

17984c5
verified

alexmarques commited on Jul 30

Create README.md

dc44c57
verified

alexmarques commited on Jul 29

Upload folder using huggingface_hub

3d7e3dc
verified

alexmarques commited on Jul 24

initial commit

a18f683
verified

alexmarques commited on Jul 24