tsdocode
/

phobert-finetune-hatespeech

Text Classification

Inference Endpoints

Model card Files Files and versions Community

tsdocode commited on May 7, 2022

Commit

e45760a

•

1 Parent(s): 7107ea1

Create README.md

Files changed (1) hide show

README.md +26 -0

README.md ADDED Viewed

	@@ -0,0 +1,26 @@

+## [PhoBert](https://huggingface.co/vinai/phobert-base/tree/main) finetuned version for hate speech detection
+## Dataset
+- [**VLSP2019**](https://github.com/sonlam1102/vihsd): Hate Speech Detection on Social Networks Dataset
+- [**ViHSD**](https://vlsp.org.vn/vlsp2019/eval/hsd): Vietnamese Hate Speech Detection dataset
+## Class name
+- LABEL_0 : **Normal**
+- LABEL_1 : **OFFENSIVE**
+- LABEL_2 : **HATE**
+## Usage example with **TextClassificationPipeline**
+```python
+from transformers import AutoModelForSequenceClassification, AutoTokenizer, TextClassificationPipeline
+model = AutoModelForSequenceClassification.from_pretrained("tsdocode/phobert-finetune-hatespeech", num_labels=3)
+tokenizer = AutoTokenizer.from_pretrained("tsdocode/phobert-finetune-hatespeech")
+pipe = TextClassificationPipeline(model=model, tokenizer=tokenizer, return_all_scores=True)
+# outputs a list of dicts like [[{'label': 'NEGATIVE', 'score': 0.0001223755971295759},  {'label': 'POSITIVE', 'score': 0.9998776316642761}]]
+pipe("đồ ngu")
+```