anatel
/

bert-augmented-pt-anatel

Sentence Similarity

sentence-transformers

feature-extraction

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

ennioferreirab commited on Nov 17, 2022

Commit

007c0f9

•

1 Parent(s): 172a9d5

Update README.md

Files changed (1) hide show

README.md +16 -3

README.md CHANGED Viewed

@@ -8,11 +8,24 @@ tags:
 ---
-# {MODEL_NAME}
-This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 768 dimensional dense vector space and can be used for tasks like clustering or semantic search.
-<!--- Describe your model here -->
 ## Usage (Sentence-Transformers)

 ---
+# anatel/bert-augmented-pt-anatel
+O modelo foi treinado seguindo a estratégia descrita no [Augmented SBERT](https://www.sbert.net/examples/training/data_augmentation/README.html) para retreinar o modelo BERT para o contexto da Anatel. O objetivo final é retreinar o modelo BERT mesmo com poucos textos rotulados para a tarefa desejada. Para a execução do script é necessário ter o modelo cross-encoder que pode ser encontrado em https://huggingface.co/anatel/cross-encoder-pt-anatel-metadados-assunto
+Config :
+    ```
+    Total de exemplos de treino = 646437
+    Total de exemplos de validação = 6530.
+    Epochs = 3
+    max_length = 512
+    train_batch_size = 8
+    Tempo de duração ~ 18h
+    Métricas = Cosine-Similarity :	Pearson: 0.9359	Spearman: 0.8874
+    ```
+# Texto default pacote sentence_transformers
 ## Usage (Sentence-Transformers)