Edit model card

Simnonym

Simnonym é um classificador BERT-based de sinônimos da língua portuguesa.

Entrada

A entrada deve sempre seguir o template do prompt

  • 'As palavras "{}" e "{}" são sinônimos?'

Dados de Treinamento

O modelo foi treinado e avaliado no conjunto de dados Sym-Pair.

Sym-Pair possui aproximadamente 1.5 milhões de sentenças que comparam pares de palavras. Esses pares podem ser sinônimos ou não.

Sym-Pair é composto por:

  • Pares de sinônimos e antônimos obtidos de dois datasets (DicSin e Portuguese Brazilian Synonyms).
  • Pares aleatórios de palavras não relacionadas. Obtidos através de combinação aleatória do conjunto de sinônimos.

Descrição do Modelo

Como Usar

Exemplo de uma única classificação: ​​

import torch
from transformers import AutoTokenizer
from transformers import AutoModelForSequenceClassification

model_name = 'lrds-code/simnonym'

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

inputs = tokenizer('As palavras "feliz" e "alegre" são sinônimos?', return_tensors='pt')

with torch.no_grad():
    output = model(**inputs).logits

predict_id = logits.argmax().item()
model.config.id2label[predict_id]
Downloads last month
0
Safetensors
Model size
109M params
Tensor type
F32
·
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Dataset used to train lrds-code/simnonym

Evaluation results