10FactCheck (Malay Multi-label Fact-checking)

10FactCheck ialah model Bahasa Melayu yang dilatih untuk multi-label classification β€” mengenal pasti 10 kriteria utama dalam penilaian fakta sesuatu maklumat atau berita tular. Ia berguna untuk proses semakan fakta automatik dalam konteks Malaysia.

πŸ” Senarai Label

Model ini meramalkan 10 label berikut:

Label Maksud
has_fact_value Adakah maklumat ini bernilai untuk semakan fakta?
causes_confusion Adakah boleh menyebabkan kekeliruan?
causes_chaos Adakah boleh mencetuskan huru-hara?
affects_government Adakah berkait dengan kerajaan/pentadbiran?
impacts_economy Adakah memberi impak ekonomi segera?
breaks_law Adakah melanggar undang-undang?
public_interest Adakah dalam kepentingan awam?
life_threatening Adakah membahayakan nyawa?
already_viral Adakah sudah tular?
time_sensitive Adakah perkara ini perlu disemak segera?

🧠 Model Details

  • Base model: rmtariq/ft-Malay-bert
  • Fine-tuned by: Dr. RM Tariqi @ Temightβ„’
  • Dataset: CheckFakta10.csv (berita viral + kolum manual dari pemerhati fakta)
  • Trained with: Hugging Face Transformers, PyTorch, Colab A100

πŸ“¦ How to Use

from transformers import pipeline

classifier = pipeline("text-classification", model="rmtariq/10factcheck", tokenizer="rmtariq/10factcheck", top_k=None, function_to_apply="sigmoid")

text = "Kenyataan ini tular di media sosial dan berk
Downloads last month
8
Safetensors
Model size
178M params
Tensor type
F32
Β·
Inference Providers NEW
This model isn't deployed by any Inference Provider. πŸ™‹ Ask for provider support