GPalomeque
commited on
Commit
•
6ba88a5
1
Parent(s):
9daa491
Update app_details.py
Browse files- app_details.py +8 -1
app_details.py
CHANGED
@@ -50,7 +50,14 @@ entrenados para el hackathon por el equipo compuesto por: gpalomeque, aureliopvs
|
|
50 |
"""
|
51 |
|
52 |
article='''
|
53 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
54 |
|
55 |
### Team
|
56 |
|
|
|
50 |
"""
|
51 |
|
52 |
article='''
|
53 |
+
El principal problema de entrenar modelos que pretenezcan a un dominio especializado como el **jurídico** que ademas sea en **español** se centra en la construcción de los **datasets** por la practicamente inexistencia de los mismos.
|
54 |
+
|
55 |
+
Es por ello que tuvimos que crear dos datasets:
|
56 |
+
|
57 |
+
- [scjnugacj/scjn_dataset_corpus_tesis] (https://huggingface.co/datasets/scjnugacj/scjn_dataset_corpus_tesis) la información base fue obtenida del **[Buscador Juridico de la SCJN de México]** (https://bj.scjn.gob.mx/) utilizando como fuente de información: Tesis y filtrando la información por décima y undécima epoca; sin embargo, fue necesario realizar procesos de ETL para la limpieza de información no relevante y estructuración de los campos
|
58 |
+
* `id`: a `string` feature.
|
59 |
+
* `text`: a `string` features.
|
60 |
+
- [scjnugacj/scjn_dataset_ner](https://huggingface.co/datasets/scjnugacj/scjn_dataset_ner)
|
61 |
|
62 |
### Team
|
63 |
|