File size: 4,162 Bytes
fbad345
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
856bc2e
9daa491
 
 
 
 
 
 
a94e850
 
9daa491
a94e850
 
 
9daa491
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6ba88a5
 
 
 
 
 
 
 
9daa491
 
a94e850
9daa491
856bc2e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
title = "Modelo Jur铆dico Mexicano"
description = """
<div id="content"> 
    <div id="left"> 
        <center>
            <img src="https://www.pactomundial.org/wp-content/uploads/2021/10/16-paz-justicia-e-instituciones-solidas-3.jpg" width=200px>
        </center>
    </div> 
    <div id="right"> 
        Este demo permite utilizar los modelos:
<ul>
  <li>hackathon-pln-es/jurisbert-finetuning-ner</li>
  <li>hackathon-pln-es/jurisbert-class-tratados-internacionales-sistema-universal</li>
  <li>hackathon-pln-es/jurisbert-clas-art-convencion-americana-dh</li>
  <li>hackathon-pln-es/jurisbert-tsdae-sentence-transformer</li>
</ul>

entrenados para el hackathon por el equipo compuesto por: gpalomeque, aureliopvs, ceciliamacias, giomadariaga y cattsytabla
 
    </div>
</div>

###  Este proyecto esta compuesto por los siguientes modelos:

- [hackathon-pln-es/jurisbert-finetuning-ner](https://huggingface.co/hackathon-pln-es/jurisbert-finetuning-ner)
- [hackathon-pln-es/jurisbert-class-tratados-internacionales-sistema-universal](https://huggingface.co/hackathon-pln-es/jurisbert-class-tratados-internacionales-sistema-universal)
- [hackathon-pln-es/jurisbert-clas-art-convencion-americana-dh](https://huggingface.co/hackathon-pln-es/jurisbert-clas-art-convencion-americana-dh)
- [hackathon-pln-es/jurisbert-tsdae-sentence-transformer](https://huggingface.co/hackathon-pln-es/jurisbert-tsdae-sentence-transformer)

### Como funciona el demo:

1. Requiere que se proporciones dos textos (el primero denominada texto a analizar y el segundo texto a comparar), los cuales se pueden selecionar de la lista de ejemplos

2. Cada uno de estos textos pasa por cada uno de los modelos que conforman el proyecto

	*  Primero, se utiliza el modelo de reconocimiento de entidades **jurisbert-finetuning-ner**. El cual, podr铆a encontrar alguna entidad de tipo LEY o TRAT_INTL

	* Segundo, se utiliza el modelo de clasificaci贸n **jurisbert-class-tratados-internacionales-sistema-universal** acorde al sistema universal de **Derechos Humanos** el cual se fundamenta en convenciones o pactos para identificar si podria existir alguna violaci贸n acorde a lo definido por la **ONU**
	
	* Tercero, se utiliza el modelo de clasificaci贸n **jurisbert-clas-art-convencion-americana-dh** para identificar cual de los art铆culos de la **[Convenci贸n Americana de Derechos Humanos](https://www.cndh.org.mx/sites/default/files/doc/Programas/TrataPersonas/MarcoNormativoTrata/InsInternacionales/Regionales/Convencion_ADH.pdf)** se podr铆a estar violentando.
	
	* Cuarto, para poder ejemplificar el modelo **jurisbert-tsdae-sentence-transformer** se aprovechan el texto a analizar y el texto a comparar para calcular la similitud entre ambos.
	
3. Se presentan los resultados obtenidos en el orden siguiemte:

	* Primero lo obtenido para el texto a analizar
	* Segundo, el porcentaje de similitud entre ambos textos
	* Tercero, lo obtenido para el texto a comparar
 
"""

article=''' 
El principal problema de entrenar modelos que pretenezcan a un dominio especializado como el **jur铆dico** que ademas sea en **espa帽ol** se centra en la construcci贸n de los **datasets** por la practicamente inexistencia de los mismos.

Es por ello que tuvimos que crear dos datasets:

- [scjnugacj/scjn_dataset_corpus_tesis] (https://huggingface.co/datasets/scjnugacj/scjn_dataset_corpus_tesis) la informaci贸n base fue obtenida del **[Buscador Juridico de la SCJN de M茅xico]** (https://bj.scjn.gob.mx/) utilizando como fuente de informaci贸n: Tesis y filtrando la informaci贸n por d茅cima y und茅cima epoca; sin embargo, fue necesario realizar procesos de ETL para la limpieza de informaci贸n no relevante y estructuraci贸n de los campos
	* `id`: a `string` feature.
	* `text`: a `string` features.
- [scjnugacj/scjn_dataset_ner](https://huggingface.co/datasets/scjnugacj/scjn_dataset_ner)

### Team

El equipo esta conformado por [gpalomeque](https://huggingface.co/GPalomeque), [aureliopvs](https://huggingface.co/aureliopvs), [ceciliamacias](https://huggingface.co/ceciliamacias), [giomadariaga](https://huggingface.co/giomadariaga) y [cattsytabla](https://huggingface.co/cattsytabla)
'''