BERTrans_Topics / README.md
carevies's picture
Update README.md
a2ab63c verified
metadata
language:
  - es
metrics:
  - accuracy
base_model:
  - distlibert-base-uncased
pipeline_tag: text-classification

Model Card for Model ID

BERTrans_topics, se diseñó para categorizar los textos trans en seis temas específicos (salud, documentación, congreso, violencia, performance y protesta) (Anexo 1 – Diccionario). Se entrenó con 2,300 frases sintéticas generadas por modelos de lenguaje (Gemini y ChatGPT), creados a partir de prompts que combinaban palabras clave ‘trans’ (Anexo 2) con términos propios de cada categoría

Model Details

Model Description

  • Developed by: Carlos Villalobos
  • Model type: Multilabel
  • Language: Spanish
  • License: Free
  • Finetuned from model: distlibert-base-uncased

Training Details

Training Data

Epoch	         Training Loss	Validation Loss	Accuracy	F1
  1	            0.042100	0.036335	0.994529	0.991928
  2	            0.029300	0.032004	0.994529	0.991928
  3	            0.001900	0.027946	0.995137	0.992832

Evaluation

          precision    recall  f1-score   support

            health      	0.933	   0.764	0.840	   55
            documentation   0.938	   0.804	0.865	   56
            congress       	0.957	   0.865	0.909	   52
            violence       	0.978	   0.759	0.854	   58
            performance     0.930	   0.816	0.870	   49
            protest       	0.976	   0.804	0.882	   51

Prompt con el que se originaron las frases para cada variable

Genera 10 frases que sitúen a las personas trans (trans, transgénero, transexual, travesti, persona trans, mujer trans, infancias trans, LGBT, queer, no binario, entre otras) en el contexto de la salud con palabras como: vacuna, paciente, medicamento, enfermedad, tratamiento, diagnostico, medicamento, condón, clínica, entre otras.”

Citation

BibTeX:

@misc{villalobos2025bertrans, author = {Villalobos, Carlos}, title = {BERTrans}, year = {2025}, publisher = {Hugging Face}, url = {https://huggingface.co/carevies/BERTrans_Topics} }

APA:

Villalobos, C. (2025). BERTrans_Topics [Modelo de lenguaje]. Hugging Face.

Anexo 1 - Diccionario

          Variable          Description

            health      	Tratamiento a problemas de salud de personas trans
            documentation   Documentos de identidad de personas trans
            congress       	Debate parlamentario e inciativas sobre personas trans
            violence       	Describe actos de violencia hacia personas trans 
            performance     Actividades culturales y artícticas de personas trans 
            protest       	Protesta de personas trans o uso del espacio público

Anexo 2 - Palabras trans

"trans", "transgénero", "transgéneros", "transexual", "transexualidad", "transexuales", "travesti", "travestista", "trasvestista", "travestis", "transvesti", "transvestis", "reasignación", "autopercibido", "magistrade", "disforia", "transfobia", "transfóbica", "genderqueer", "queer", "binario", "transincluyente", "transexcluyente", "TERF", "muxe", "LGBT", "LGBT+", "LGBTI", "LGBTI+", "LGBTT", "LGBTT+", "LGBTTT", "LGBTTT+", "LGBTTTI", "LGBTTTI+", "LGBTTTIQ", "LGBTTTIQ+", "LGBTTTIQA", "LGBTTTIQA+", "LGBTQ", "LGBTQ+", "LGBTQI", "LGBTQI+", "LGBTQIA", "LGBTQIA+", "Drag", "personas trans", "población trans", "cambio de sexo", "reasignación de sexo", "sexo asignado", "reasignación de género", "género autopercibido", "cirugía de cambio de sexo", "disforia de género", "identidad trans", "identidad de género", "derechos trans", "derechos de los trans", "discriminación trans", "odio trans", "violencia trans", "feminicidio trans", "personas no binarias", "no binario", "no binaria", "no binarie", "género no binario", "género fluido", "genderqueer", "queer", "tercer género", "pronombres no binarios", "representación trans", "visibilidad trans", "marchas trans", "orgullo trans", "movimiento trans", "activismo trans", "colectivos trans", "ONG trans", "Pride", "Marcha del Orgullo", "Orgullo Gay", "expresión de género", "reconocimiento legal trans", "cambio de identidad de género", "ley de identidad de género", "mujeres trans", "hombres trans", "infancias trans", "salud trans", "hormonización trans", "terapia de reemplazo hormonal", "Clínica Condesa", "Grupo Eon", "Inteligencia Transgenérica", "Frente Pro Derechos Transgénero y Transexuales", "Red de Trabajo Trans", "Coalisión T47", "Almas Cautivas", "Impulso Trans", "Kenya Cuevas", "Paolita Suárez", "Casa de las Muñecas Tiresias", "trabajadoras sexuales trans", "trans en prisión", "TERF", "migración trans", "diversidad sexual".