Florian
initial commit
1347818
https://huggingface.co/nreimers/mmarco-mMiniLMv2-L6-H384-v1
optimized with onnx o4
```
from pathlib import Path
from transformers import AutoTokenizer
from optimum.onnxruntime import ORTModelForSequenceClassification, ORTOptimizer
from optimum.onnxruntime import AutoOptimizationConfig
model = "nreimers/mmarco-mMiniLMv2-L6-H384-v1"
tokenizer = AutoTokenizer.from_pretrained(model)
ort_model = ORTModelForSequenceClassification.from_pretrained(model, export=True)
save_dir = Path("/tmp/optimized_models")
save_dir.mkdir(exist_ok=True, parents=True)
optimizer = ORTOptimizer.from_pretrained(ort_model)
optimizer.optimize(
optimization_config=AutoOptimizationConfig.O4(),
save_dir=save_dir,
)
```
Run it with onnx
```
import torch
from transformers import AutoTokenizer
from transformers.pipelines.text_classification import ClassificationFunction
from optimum.pipelines import pipeline as ort_pipeline
from optimum.onnxruntime import ORTModelForSequenceClassification
model = "Slite/mmarco-mMiniLMv2-L6-H384-v1-onnx-o4"
device = torch.device(0) if torch.cuda.is_available() else -1
tokenizer = AutoTokenizer.from_pretrained(model)
ort_model = ORTModelForSequenceClassification.from_pretrained(
model, file_name="model_optimized.onnx")
cross_encoder = ort_pipeline(
task="text-classification",
model=ort_model,
tokenizer=tokenizer,
device=device,
function_to_apply=ClassificationFunction.SIGMOID,
padding=True,
truncation=True)
cross_encoder([{
"text":
"Quel est le but de la vie ?",
"text_pair":
"Le but de la vie est une question subjective et dépend de la croyance et de la perspective personnelle de chaque individu. Pour certains, le but peut être de trouver la bonheur et le contentement personnel, pour d'autres cela peut être de faire une différence positive dans le monde, de vivre en harmonie avec les autres, de découvrir la signification et le propre but de leur existence, entre autres. En fin de compte, le but de la vie est déterminé par chaque individu eux-mêmes."
}])
```