BrayamArdila
commited on
Commit
路
cdd343b
1
Parent(s):
c4213c0
Update README.md
Browse files
README.md
CHANGED
@@ -2,10 +2,14 @@
|
|
2 |
license: gpl
|
3 |
---
|
4 |
|
|
|
|
|
5 |
|
6 |
# Nombre del modelo: BAAO
|
7 |
|
8 |
-
|
|
|
|
|
9 |
|
10 |
# Descripci貌n
|
11 |
|
@@ -13,6 +17,18 @@ Este modelo utiliza la arquitectura T5 de Transformers para tareas de procesamie
|
|
13 |
centradas en la generaci贸n de texto. Se implemento y entreno usando PyTorch Lightning,
|
14 |
lo que facilita la escalabilidad y eficiencia en el entrenamiento.
|
15 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16 |
|
17 |
# Caracter矛sticas del modelo
|
18 |
|
@@ -33,3 +49,6 @@ Divisi贸n de Datos: Dividido en conjuntos de entrenamiento y prueba para una eva
|
|
33 |
Base: T5ForConditionalGeneration de la biblioteca Transformers.
|
34 |
Personalizaci贸n: Implementaci贸n dentro de una clase T5Model que extiende pl.LightningModule,
|
35 |
lo que indica una integraci贸n con PyTorch Lightning para gestionar el entrenamiento y la validaci贸n.
|
|
|
|
|
|
|
|
2 |
license: gpl
|
3 |
---
|
4 |
|
5 |
+
# Nombre del estudiante: Brayam Arvey Ardila
|
6 |
+
|
7 |
|
8 |
# Nombre del modelo: BAAO
|
9 |
|
10 |
+
Se enfoca en la implementaci贸n y entrenamiento de un modelo de procesamiento
|
11 |
+
de lenguaje natural basado en la arquitectura T5, utilizando la biblioteca Transformers de Hugging Face.
|
12 |
+
|
13 |
|
14 |
# Descripci貌n
|
15 |
|
|
|
17 |
centradas en la generaci贸n de texto. Se implemento y entreno usando PyTorch Lightning,
|
18 |
lo que facilita la escalabilidad y eficiencia en el entrenamiento.
|
19 |
|
20 |
+
# Funcionamiento:
|
21 |
+
|
22 |
+
El proceso comienza con la instalaci贸n de las bibliotecas necesarias: transformers, sentencepiece
|
23 |
+
y pytorch_lightning. Estas bibliotecas proporcionan las herramientas para trabajar con modelos de
|
24 |
+
lenguaje avanzados y facilitan el manejo del entrenamiento y la validaci贸n de modelos.
|
25 |
+
|
26 |
+
Se utiliza una clase personalizada, T5Dataset, para preparar y gestionar los datos.
|
27 |
+
El modelo se construye y entrena dentro de una clase T5Model, que hereda de pl.LightningModule.
|
28 |
+
Esto implica que el modelo se beneficia de las caracter铆sticas de PyTorch Lightning, como la gesti贸n
|
29 |
+
eficiente del entrenamiento y la escalabilidad. El entrenamiento del modelo se realiza con callbacks
|
30 |
+
y checkpoints para monitorizar y guardar el progreso.
|
31 |
+
|
32 |
|
33 |
# Caracter矛sticas del modelo
|
34 |
|
|
|
49 |
Base: T5ForConditionalGeneration de la biblioteca Transformers.
|
50 |
Personalizaci贸n: Implementaci贸n dentro de una clase T5Model que extiende pl.LightningModule,
|
51 |
lo que indica una integraci贸n con PyTorch Lightning para gestionar el entrenamiento y la validaci贸n.
|
52 |
+
|
53 |
+
# Parte del modelo es tomado de:
|
54 |
+
|