Instructions to use jacob-ml/LS-Bert-67m with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use jacob-ml/LS-Bert-67m with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-classification", model="jacob-ml/LS-Bert-67m")# Load model directly from transformers import AutoTokenizer, AutoModelForSequenceClassification tokenizer = AutoTokenizer.from_pretrained("jacob-ml/LS-Bert-67m") model = AutoModelForSequenceClassification.from_pretrained("jacob-ml/LS-Bert-67m") - Notebooks
- Google Colab
- Kaggle
Dieses Repository beinhaltet einen State-of-the-Art-Classifier zur Unterscheidung von Texten in Leichter Sprache und komplexem Deutsch. Dem Classifier gelingt hierbei sogar eine sichere Unterscheidung zwischen Texten in Leichter und Einfacher Sprache. Ausgegebene Labels sind yes und no, wobei ein yes signalisiert, dass der vorliegende Text hohe Übereinstimmungen mit tatsächlichen, geprüften Texten in Leichter Sprache hat.
Er wurde auf über 11.000 Beispielen von reinem, aufgearbeitetem Text trainiert. Es kam keine synthetische Datengenerierung, sondern ein pures Training auf von durch menschliche Prüfer:innen als lesbar bewerteten Texten in Leichter Sprache zum Einsatz.
Der Classifier wird kostenfrei online angeboten, um bereits erste Proben mit ihm durchzuführen.
In späteren Iterationen des Projekts ist ein Training von Jacob 24b mittels RLHF und diesem Modell als "reward predictor" geplant.
- Downloads last month
- 97