Uploaded finetuned model

  • Developed by: OL-Neuland
  • License: apache-2.0
  • Finetuned from model : unsloth/ministral-3-8b-instruct-2512-unsloth-bnb-4bit

This mistral3 model was trained 2x faster with Unsloth and Huggingface's TRL library.

📄 Ministral-8B-InvoiceXpert

Über das Modell

Dieses Modell wurde im Rahmen eines IHK-Abschlussprojekts entwickelt. Es handelt sich um ein feingetuntes Vision-Language-Modell (VLM), das darauf spezialisiert ist, deutsche Rechnungen und Belege zu lesen und in hochstrukturierte Markdown-Formate (inklusive Kopfdaten und Positionstabellen) zu konvertieren.

Basis-Modell: ministral-3-8b-instruct Training: Finetuning via LoRA (Vision & Language Layers) mit unsloth in bfloat16.

🎯 Anwendungsfall

Das Modell dient als Kernkomponente für ein automatisiertes, lokales Rechnungsarchiv. Es extrahiert selbstständig:

  • Rechnungsnummer, Datum, Absender, Gesamtbetrag
  • Tabellarische Auflistung aller Rechnungspositionen
  • Schlechtes Scannen oder unleserliche Bereiche (markiert als [unleserlich])

⚠️ System Prompt

Um die korrekte Struktur zu erhalten, muss folgender System-Prompt verwendet werden:

Du bist ein präziser KI-Archivar. Deine Aufgabe ist es, die angehängte Rechnung oder den Beleg für ein durchsuchbares Volltext-Archiv zu transkribieren und zu strukturieren. Halte dich strikt an diese Regeln:

  1. Nur Text: Gib ausschließlich den transkribierten und strukturierten Inhalt aus.
  2. Kopfdaten: Erfasse die wichtigsten Rahmendaten übersichtlich am Anfang (z.B. Absender, Datum, Rechnungsnummer, Gesamtbetrag).
  3. Tabellen-Format: Wenn auf der Rechnung einzelne Positionen/Artikel aufgelistet sind, wandle diese zwingend in eine saubere Markdown-Tabelle um.
  4. Keine Halluzinationen: Erfinde niemals Zahlen, Artikel oder Namen hinzu.
  5. Umgang mit Schäden: Wenn ein Wort unleserlich ist, schreibe [unleserlich].

💻 Nutzung (Python / Unsloth)

Da aktuelle Client-Tools (wie LM Studio / Ollama) die neuartige Architektur des Ministral-Vision-Projectors derzeit noch nicht nativ unterstützen, wird die Nutzung über Python empfohlen:

Downloads last month
5
Safetensors
Model size
9B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Dataset used to train OL-Neuland/Ministral-8B-InvoiceXpert