Quark Quantized ONNX LLMs for Ryzen AI 1.3 EA - a amd Collection

amd 's Collections

quark_awq_g128_int4_asym_bf16_onnx_npu 1.3

quark_awq_g128_int4_asym_fp16_onnx_hybrid 1.3

quark_awq_g128_int4_asym_fp16_onnx_dml

Quark Quantized INT8 Models

AMD Nitro Diffusion

Quark Quantized Diffusion Models

Quark Quantized ONNX LLMs for Ryzen AI 1.3 EA

Quark Quantized OCP FP8 Models

Quark ONNX: int8 Quantized Models

Quark Quantized INT4 Models

Quark Quantized INT4 ONNX Models

Quark Quantized ONNX LLMs for Ryzen AI 1.3 EA

updated Oct 9

ONNX Runtime generate() API based models quantized by Quark and optimized for Ryzen AI Strix Point NPU