RoundtTble
/

dinov2_vitl14_trt_a4000

Model card Files Files and versions Community

RoundtTble commited on Jul 26, 2023

Commit

14756bb

•

1 Parent(s): 116c902

Update makefile

Files changed (1) hide show

Makefile +4 -3

Makefile CHANGED Viewed

@@ -18,7 +18,8 @@ trt:
 		"trtexec --onnx=onnx/model.onnx --saveEngine=$(MODEL_PATH)/model.plan \
 			--minShapes=input:1x3x560x560 \
 			--optShapes=input:2x3x560x560 \
-			--maxShapes=input:8x3x560x560"
 triton:
@@ -26,9 +27,9 @@ triton:
 		--name dinov2_vitl14_triton \
 		-p 8000:8000 --gpus "device=0" -p 8001:8001 -p 8002:8002 \
 		-v $(PWD)/model_repository:/models \
-		nvcr.io/nvidia/tritonserver:23.04-py3 \
 		tritonserver --model-repository=/models
 perf:
-	docker run --gpus all --rm -it --net host nvcr.io/nvidia/tritonserver:23.04-py3-sdk perf_analyzer -m dinov2_vitl14 --percentile=95 -i grpc -u 0.0.0.0:8001 --concurrency-range 16:16 --shape input:3,560,560

 		"trtexec --onnx=onnx/model.onnx --saveEngine=$(MODEL_PATH)/model.plan \
 			--minShapes=input:1x3x560x560 \
 			--optShapes=input:2x3x560x560 \
+			--maxShapes=input:8x3x560x560 \
+			--fp16"
 triton:
 		--name dinov2_vitl14_triton \
 		-p 8000:8000 --gpus "device=0" -p 8001:8001 -p 8002:8002 \
 		-v $(PWD)/model_repository:/models \
+		nvcr.io/nvidia/tritonserver:23.06-py3 \
 		tritonserver --model-repository=/models
 perf:
+	docker run --gpus all --rm -it --net host nvcr.io/nvidia/tritonserver:23.06-py3-sdk perf_analyzer -m dinov2_vitl14 --percentile=95 -i grpc -u 0.0.0.0:8001 --concurrency-range 16:16 --shape input:3,560,560