Edit model card

This model performs subject detect on Turkish texts. It gives sevent outputs:

  • "0": "Science & Technology"
  • "1": "World"
  • "2": "Education"
  • "3": "Economy"
  • "4": "Current Events"
  • "5": "Agenda"
  • "6": "Culture & Art & History"
  • "7": "Health"
  • "8": "Sports"
  • "9": "Lifestyle"

The model usage is as follows:

FYI: You can replace the folder redirect with "erythropygia/bert-turkish-subject" in the appropriate fields.

import torch
from transformers import AutoModelForSequenceClassification AutoTokenizer, AutoConfig, pipeline

config_subject = AutoConfig.from_pretrained("erythropygia/bert-turkish-subject")
model_subject = AutoModelForSequenceClassification.from_pretrained('erythropygia/bert-turkish-subject', config=config_subject)
tokenizer_subject = AutoTokenizer.from_pretrained("erythropygia/bert-turkish-subject")

device = torch.device('cpu') #or 'cuda'

subject_pipeline = pipeline(
    task='text-classification',
    model=model_subject,
    tokenizer=tokenizer_subject,
    framework='pt',
    #device=device
)

input = "Ulus devlet kavramı, 18. yüzyılda aydınlanma düşüncesinin etkisiyle daha da yaygınlaşmış ve 19. yüzyılda Avrupa'da birçok ulus devlet kurulmuştur. Örneğin, Almanya ve İtalya, 1871'de modern anlamda ulus devletler haline gelmiştir.
       Dünya genelinde ulus devletlerin yaygınlaşması 20. yüzyılın başlarına kadar devam etmiştir. Bugün, dünya genelinde birçok ulus devlet bulunmaktadır ve bu devletler, çoğunlukla belirli bir ulusun siyasi sınırlar içinde örgütlenmesini temsil etmektedir."

subject_result = subject_pipeline(input)
print(subject_result)
Downloads last month
7