10FactCheck (Malay Multi-label Fact-checking)

10FactCheck ialah model Bahasa Melayu yang dilatih untuk multi-label classification β€” mengenal pasti 10 kriteria utama dalam penilaian fakta sesuatu maklumat atau berita tular. Ia berguna untuk proses semakan fakta automatik dalam konteks Malaysia.

πŸ” Senarai Label

Model ini meramalkan 10 label berikut:

Label Maksud
has_fact_value Adakah maklumat ini bernilai untuk semakan fakta?
causes_confusion Adakah boleh menyebabkan kekeliruan?
causes_chaos Adakah boleh mencetuskan huru-hara?
affects_government Adakah berkait dengan kerajaan/pentadbiran?
impacts_economy Adakah memberi impak ekonomi segera?
breaks_law Adakah melanggar undang-undang?
public_interest Adakah dalam kepentingan awam?
life_threatening Adakah membahayakan nyawa?
already_viral Adakah sudah tular?
time_sensitive Adakah perkara ini perlu disemak segera?

🧠 Model Details

  • Base model: rmtariq/ft-Malay-bert
  • Fine-tuned by: Dr. RM Tariqi @ Temightβ„’
  • Dataset: CheckFakta10.csv (berita viral + kolum manual dari pemerhati fakta)
  • Trained with: Hugging Face Transformers, PyTorch, Colab A100

πŸ“¦ How to Use

from transformers import pipeline

classifier = pipeline("text-classification", model="rmtariq/10factcheck", tokenizer="rmtariq/10factcheck", top_k=None, function_to_apply="sigmoid")

text = "Kenyataan ini tular di media sosial dan berk
Downloads last month
10
Safetensors
Model size
178M params
Tensor type
F32
Β·
Inference Providers NEW
This model isn't deployed by any Inference Provider. πŸ™‹ Ask for provider support