Overview
Model ini merupakan hasil fine-tuning dari IndoBERT (indolem/indobert-base-uncased) untuk tugas klasifikasi topik hukum. Model ini dilatih untuk mengklasifikasikan topik hukum dari suatu pertanyaan atau gugatan yang diajukan pada forum HukumOnline.com. Dengan menggunakan model ini, pengguna dapat dengan cepat mengidentifikasi kategori hukum yang relevan dari sebuah pertanyaan atau kasus hukum, memungkinkan untuk triase yang lebih efisien dan pengarahan ke sumber daya atau ahli yang tepat.
Dataset
Dataset berikut ini berisi 8500+ data QnA tentang pengaduan atau pertanyaan hukum di Indonesia yang telah di-scrap dari HukumOnline:
Model Card
Fine tuning menggunakan model Transformer indolem/indobert-base-uncased
Epoch | Training Loss | Validation Loss | F1 |
---|---|---|---|
1 | 0.92132 | 1.232132 | 81.32 |
2 | 0.842132 | 1.032132 | 81.53 |
3 | 0.812321 | 0.9321324 | 82.139 |
4 | 0.788542 | 0.832132 | 83.832 |
5 | 0.75321321 | 0.7732143 | 84.3132 |
6 | 0.2321321 | 0.432143 | 84.543 |
7 | 0.13321 | 0.42324 | 85.8934 |
8 | 0.0321343 | 0.412321 | 86.3213 |
How to Use
Use a pipeline as a high-level helper
from transformers import pipeline
pipe = pipeline("text-classification", model="fathurfrs/indobert-classifying-topik-hukum-indonesia")
Use model directly
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("fathurfrs/indobert-classifying-topik-hukum-indonesia")
model = AutoModelForSequenceClassification.from_pretrained("fathurfrs/indobert-classifying-topik-hukum-indonesia")
- Downloads last month
- 108
Inference Providers
NEW
This model is not currently available via any of the supported Inference Providers.