mlx-vision
/

vit_large_patch16_224.swag_lin-mlxim

Image Classification

Model card Files Files and versions Community

riccardomusmeci commited on Mar 20, 2024

Commit

069dcba

·

verified ·

1 Parent(s): 12ba3d9

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -9,7 +9,7 @@ datasets:
 - imagenet-1k
 library_name: mlx-image
 ---
-#  vit_large_patch16_224.swag_lin-mlxim
 A [Vision Transformer](https://arxiv.org/abs/2010.11929v2) image classification model. Weights are learned with [SWAG](https://arxiv.org/abs/2201.08371) on ImageNet-1k data.
@@ -32,7 +32,7 @@ transform = ImageNetTransform(train=False, img_size=224)
 x = transform(read_rgb("cat.png"))
 x = mx.expand_dims(x, 0)
-model = create_model(" vit_large_patch16_224.swag_lin-mlxim")
 model.eval()
 logits = model(x)
@@ -49,16 +49,16 @@ x = transform(read_rgb("cat.png"))
 x = mx.expand_dims(x, 0)
 # first option
-model = create_model(" vit_large_patch16_224.swag_lin-mlxim", num_classes=0)
 model.eval()
 embeds = model(x)
 # second option
-model = create_model(" vit_large_patch16_224.swag_lin-mlxim")
 model.eval()
-embeds = model.features(x)
 ```

 - imagenet-1k
 library_name: mlx-image
 ---
+#  vit_large_patch16_224.swag_lin
 A [Vision Transformer](https://arxiv.org/abs/2010.11929v2) image classification model. Weights are learned with [SWAG](https://arxiv.org/abs/2201.08371) on ImageNet-1k data.
 x = transform(read_rgb("cat.png"))
 x = mx.expand_dims(x, 0)
+model = create_model("vit_large_patch16_224.swag_lin")
 model.eval()
 logits = model(x)
 x = mx.expand_dims(x, 0)
 # first option
+model = create_model("vit_large_patch16_224.swag_lin", num_classes=0)
 model.eval()
 embeds = model(x)
 # second option
+model = create_model("vit_large_patch16_224.swag_lin")
 model.eval()
+embeds = model.get_features(x)
 ```