Overview

Model ini merupakan hasil fine-tuning dari IndoBERT (indolem/indobert-base-uncased) untuk tugas klasifikasi topik hukum. Model ini dilatih untuk mengklasifikasikan topik hukum dari suatu pertanyaan atau gugatan yang diajukan pada forum HukumOnline.com. Dengan menggunakan model ini, pengguna dapat dengan cepat mengidentifikasi kategori hukum yang relevan dari sebuah pertanyaan atau kasus hukum, memungkinkan untuk triase yang lebih efisien dan pengarahan ke sumber daya atau ahli yang tepat.

Dataset

Dataset berikut ini berisi 8500+ data QnA tentang pengaduan atau pertanyaan hukum di Indonesia yang telah di-scrap dari HukumOnline:

Model Card

Fine tuning menggunakan model Transformer indolem/indobert-base-uncased

Epoch Training Loss Validation Loss F1
1 0.92132 1.232132 81.32
2 0.842132 1.032132 81.53
3 0.812321 0.9321324 82.139
4 0.788542 0.832132 83.832
5 0.75321321 0.7732143 84.3132
6 0.2321321 0.432143 84.543
7 0.13321 0.42324 85.8934
8 0.0321343 0.412321 86.3213

How to Use

Use a pipeline as a high-level helper

from transformers import pipeline

pipe = pipeline("text-classification", model="fathurfrs/indobert-classifying-topik-hukum-indonesia")

Use model directly

from transformers import AutoTokenizer, AutoModelForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained("fathurfrs/indobert-classifying-topik-hukum-indonesia")
model = AutoModelForSequenceClassification.from_pretrained("fathurfrs/indobert-classifying-topik-hukum-indonesia")
Downloads last month
108
Safetensors
Model size
124M params
Tensor type
F32
·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.