qualcomm
/

ConvNext-Tiny-w8a8-Quantized

qaihm-bot commited on Jun 26

Commit

96f98ae

•

1 Parent(s): 8dc0fce

Upload README.md with huggingface_hub

Files changed (1) hide show

README.md CHANGED Viewed

@@ -39,7 +39,7 @@ More details on model performance across various devices, can be found
 | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 | ---|---|---|---|---|---|---|---|
-| Samsung Galaxy S23 Ultra (Android 13) | Snapdragon® 8 Gen 2 | QNN Model Library | 1.723 ms | 0 - 121 MB | INT8 | NPU |  [ConvNext-Tiny-w8a8-Quantized.so](https://huggingface.co/qualcomm/ConvNext-Tiny-w8a8-Quantized/blob/main/ConvNext-Tiny-w8a8-Quantized.so)
@@ -102,8 +102,8 @@ python -m qai_hub_models.models.convnext_tiny_w8a8_quantized.export
 Profile Job summary of ConvNext-Tiny-w8a8-Quantized
 --------------------------------------------------
 Device: Snapdragon X Elite CRD (11)
-Estimated Inference Time: 1.92 ms
-Estimated Peak Memory Range: 0.48-0.48 MB
 Compute Units: NPU (215) | Total (215)

 | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 | ---|---|---|---|---|---|---|---|
+| Samsung Galaxy S23 Ultra (Android 13) | Snapdragon® 8 Gen 2 | QNN Model Library | 1.711 ms | 0 - 121 MB | INT8 | NPU |  [ConvNext-Tiny-w8a8-Quantized.so](https://huggingface.co/qualcomm/ConvNext-Tiny-w8a8-Quantized/blob/main/ConvNext-Tiny-w8a8-Quantized.so)
 Profile Job summary of ConvNext-Tiny-w8a8-Quantized
 --------------------------------------------------
 Device: Snapdragon X Elite CRD (11)
+Estimated Inference Time: 1.81 ms
+Estimated Peak Memory Range: 0.42-0.42 MB
 Compute Units: NPU (215) | Total (215)