neuralmagic
/

Meta-Llama-3.1-405B-FP8

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-405B-FP8

Commit History

Updated compression_config to quantization_config

e6569ff
verified

mgoin commited on Oct 9

Update README.md

7f8d838
verified

alexmarques commited on Aug 13

Update README.md

5ffc8cf
verified

mgoin commited on Aug 8

Update README.md

ffde252
verified

Lin-K76 commited on Aug 6

Create README.md

8e23885
verified

Lin-K76 commited on Aug 6

Upload folder using huggingface_hub

ff4cae8
verified

Lin-K76 commited on Aug 2

initial commit

3a77955
verified

Lin-K76 commited on Aug 1