Model Card

Model Description

This is a Large Language Model (LLM) trained on a subset of the dataset "mlabonne/orpo-dpo-mix-40k".

Metric	Value
Accuracy	0.4517

To use this model, simply download the checkpoint and load it into your preferred deep learning framework.

Safetensors

Model size

1.24B params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

(312)

this model