https://huggingface.co/nreimers/mmarco-mMiniLMv2-L6-H384-v1 optimized with onnx o4 ``` from pathlib import Path from transformers import AutoTokenizer from optimum.onnxruntime import ORTModelForSequenceClassification, ORTOptimizer from optimum.onnxruntime import AutoOptimizationConfig model = "nreimers/mmarco-mMiniLMv2-L6-H384-v1" tokenizer = AutoTokenizer.from_pretrained(model) ort_model = ORTModelForSequenceClassification.from_pretrained(model, export=True) save_dir = Path("/tmp/optimized_models") save_dir.mkdir(exist_ok=True, parents=True) optimizer = ORTOptimizer.from_pretrained(ort_model) optimizer.optimize( optimization_config=AutoOptimizationConfig.O4(), save_dir=save_dir, ) ``` Run it with onnx ``` import torch from transformers import AutoTokenizer from transformers.pipelines.text_classification import ClassificationFunction from optimum.pipelines import pipeline as ort_pipeline from optimum.onnxruntime import ORTModelForSequenceClassification model = "Slite/mmarco-mMiniLMv2-L6-H384-v1-onnx-o4" device = torch.device(0) if torch.cuda.is_available() else -1 tokenizer = AutoTokenizer.from_pretrained(model) ort_model = ORTModelForSequenceClassification.from_pretrained( model, file_name="model_optimized.onnx") cross_encoder = ort_pipeline( task="text-classification", model=ort_model, tokenizer=tokenizer, device=device, function_to_apply=ClassificationFunction.SIGMOID, padding=True, truncation=True) cross_encoder([{ "text": "Quel est le but de la vie ?", "text_pair": "Le but de la vie est une question subjective et dépend de la croyance et de la perspective personnelle de chaque individu. Pour certains, le but peut être de trouver la bonheur et le contentement personnel, pour d'autres cela peut être de faire une différence positive dans le monde, de vivre en harmonie avec les autres, de découvrir la signification et le propre but de leur existence, entre autres. En fin de compte, le but de la vie est déterminé par chaque individu eux-mêmes." }]) ```