Commits · amd-shark/sdxl-quant-fp8

Upload unet_int8_sdpa_fp8_ocp/params.safetensors with huggingface_hub

e6e3c03
verified

GiusFra commited on Mar 4

Upload unet_int8_sdpa_fp8_ocp/quant_params.json with huggingface_hub

832910d
verified

GiusFra commited on Mar 4

Upload unet_int8_sdpa_fp8_vae_int8_v2/vae_quant_params.json with huggingface_hub

9436fb6
verified

GiusFra commited on Feb 28

Upload unet_int8_sdpa_fp8_vae_int8_v2/vae_params.safetensors with huggingface_hub

f4b3910
verified

GiusFra commited on Feb 28

Upload unet_int8_sdpa_fp8_vae_int8_v2/vae_params.safetensors with huggingface_hub

b1a165a
verified

GiusFra commited on Feb 27

Upload unet_int8_sdpa_fp8_vae_int8_v2/params.safetensors with huggingface_hub

7d0b300
verified

GiusFra commited on Feb 27

Upload unet_int8_sdpa_fp8_vae_int8_v2/quant_params.json with huggingface_hub

75d97e8
verified

GiusFra commited on Feb 27

Upload unet_int8_sdpa_fp8_vae_int8_v2/vae_params.safetensors with huggingface_hub

2266191
verified

GiusFra commited on Feb 27

Upload unet_int8_sdpa_fp8_vae_int8_v2/vae_quant_params.json with huggingface_hub

bb58fb1
verified

GiusFra commited on Feb 27

Create config.json

ae57958
verified

GiusFra commited on Feb 21

Upload unet_int8_sdpa_fp8_vae_int8/vae_quant_params.json with huggingface_hub

f61f04f
verified

GiusFra commited on Feb 20

Upload unet_int8_sdpa_fp8_vae_int8/unet_quant_params.json with huggingface_hub

59590aa
verified

GiusFra commited on Feb 20

Upload unet_int8_sdpa_fp8_vae_int8/vae_params.safetensors with huggingface_hub

1dbb8b4
verified

GiusFra commited on Feb 20

Upload unet_int8_sdpa_fp8_vae_int8/unet_params.safetensors with huggingface_hub

99cda0b
verified

GiusFra commited on Feb 20

Upload all_quant_int8_sdpa_fp8/params.safetensors with huggingface_hub

8e60988
verified

GiusFra commited on Feb 19

Upload all_quant_int8_sdpa_fp8/quant_params.json with huggingface_hub

008bca6
verified

GiusFra commited on Feb 19

[math_model] Make it more obvious that softmax scale comes from the quantizer

db5a15b

nickfraser commited on Dec 17, 2024

Create math_model.py

6f59b43
verified

GiusFra commited on Dec 15, 2024

Upload nvidia_fp8_unet/params.safetensors with huggingface_hub

d9e66a0
verified

GiusFra commited on Oct 3, 2024

Upload nvidia_fp8_unet/quant_params.json with huggingface_hub

730c8f5
verified

GiusFra commited on Oct 3, 2024

Upload nvidia_fp8_unet/results_mlperf.json with huggingface_hub

f4037ed
verified

GiusFra commited on Oct 3, 2024

Upload nvidia_fp8_unet/args.json with huggingface_hub

4e70299
verified

GiusFra commited on Oct 3, 2024

Create config.json

b0f9624
verified

GiusFra commited on Oct 1, 2024

Create config.json

b7db598
verified

GiusFra commited on Oct 1, 2024

Create config.json

864a3a2
verified

GiusFra commited on Oct 1, 2024

Create config.json

25e566b
verified

GiusFra commited on Oct 1, 2024

Updated sdpa fp8 models

fa0155f

nickfraser commited on Sep 13, 2024

Added models that are fully quantized with FP8.

cfd94d7

nickfraser commited on Sep 10, 2024