10FactCheck (Malay Multi-label Fact-checking)
10FactCheck
ialah model Bahasa Melayu yang dilatih untuk multi-label classification β mengenal pasti 10 kriteria utama dalam penilaian fakta sesuatu maklumat atau berita tular. Ia berguna untuk proses semakan fakta automatik dalam konteks Malaysia.
π Senarai Label
Model ini meramalkan 10 label berikut:
Label | Maksud |
---|---|
has_fact_value |
Adakah maklumat ini bernilai untuk semakan fakta? |
causes_confusion |
Adakah boleh menyebabkan kekeliruan? |
causes_chaos |
Adakah boleh mencetuskan huru-hara? |
affects_government |
Adakah berkait dengan kerajaan/pentadbiran? |
impacts_economy |
Adakah memberi impak ekonomi segera? |
breaks_law |
Adakah melanggar undang-undang? |
public_interest |
Adakah dalam kepentingan awam? |
life_threatening |
Adakah membahayakan nyawa? |
already_viral |
Adakah sudah tular? |
time_sensitive |
Adakah perkara ini perlu disemak segera? |
π§ Model Details
- Base model:
rmtariq/ft-Malay-bert
- Fine-tuned by: Dr. RM Tariqi @ Temightβ’
- Dataset:
CheckFakta10.csv
(berita viral + kolum manual dari pemerhati fakta) - Trained with: Hugging Face Transformers, PyTorch, Colab A100
π¦ How to Use
from transformers import pipeline
classifier = pipeline("text-classification", model="rmtariq/10factcheck", tokenizer="rmtariq/10factcheck", top_k=None, function_to_apply="sigmoid")
text = "Kenyataan ini tular di media sosial dan berk
- Downloads last month
- 8
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
π
Ask for provider support
HF Inference deployability: The model has no library tag.