jalbarracin commited on
Commit
2c2c116
1 Parent(s): 38d8d24

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +68 -0
README.md CHANGED
@@ -1,3 +1,71 @@
1
  ---
2
  license: apache-2.0
 
 
 
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: apache-2.0
3
+ language: es
4
+ datasets:
5
+ - bertin-project/alpaca-spanish
6
+ pipeline_tag: text2text-generation
7
+ tags:
8
+ - salpaca
9
+ - mT5
10
+ - spanish
11
  ---
12
+
13
+ Esta es una versión más pequeña del modelo google/mt5-base con embeddings solo en español y algunas en inglés obtenidas de https://huggingface.co/JorgeSarry/
14
+ El número de parámetros del modelo es de 244 millones de parámetros, lo que da como resultado un modelo de 0,9 GB, el 42 % del original.
15
+
16
+ Puedes usar este modelo utilizando el tag "instrut5:"
17
+
18
+ =====
19
+
20
+ This is a smaller version of the google/mt5-base model with only Spanish and some English embeddings obtained from https://huggingface.co/JorgeSarry/
21
+ The number of model parameters is 244M parameters, resulting on a model of 0.9GB - 42% of the original one.
22
+
23
+ You can use this model starging with the tag "instrut5:"
24
+
25
+ ---
26
+
27
+ # Spanish Alpaca mT5
28
+
29
+ This repository contains a mT5 fine-tuned model on the [Bertin Project - Alpaca Spanish](https://huggingface.co/datasets/bertin-project/alpaca-spanish) cleaned version dataset.
30
+
31
+ # Usage
32
+
33
+ ## Using the model
34
+
35
+ The model was trained on the following kind of code that shows the prompt as 'input_text' and the output:
36
+
37
+ ```python
38
+ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
39
+
40
+ model = 'jalbarracin/spanish-alpaca-mT5'
41
+ model_tokenizer = 'jalbarracin/spanish-alpaca-mT5'
42
+ tokenizer = AutoTokenizer.from_pretrained(model_tokenizer)
43
+ model = AutoModelForSeq2SeqLM.from_pretrained(model).to('cpu') #puedes cambiar a 'cuda' si tienes GPU
44
+
45
+ input_text ="""instrut5: QuanticoTrends (https://www.quanticotrends.com/) se dedica al monitoreo de redes sociales para empresas. Escribe un anuncio para anunciar los servicios de QuanticoTrends en facebook<in></in>"""
46
+
47
+ inputs = tokenizer(input_text, return_tensors="pt").to('cpu') #puedes cambiar a 'cuda' si tienes GPU
48
+
49
+ outputs = model.generate(inputs["input_ids"],
50
+ do_sample = True,
51
+ max_length = 500,
52
+ num_return_sequences=3, #recomiendo hasta 6 para que no demore mucho
53
+ top_k=50,
54
+ top_p=0.90,
55
+ )
56
+ detok_outputs = [tokenizer.decode(x, skip_special_tokens=True) for x in outputs]
57
+
58
+ for output in detok_outputs:
59
+ print(output)
60
+ print("/n") # imprime un salto de linea para separar cada uno de los outputs (en el caso que num_return_sequences sea mayor que 1)
61
+ ```
62
+
63
+ El output de este ejemplo:
64
+
65
+ ```python
66
+ ¡¿Echa un vistazo a nosotros y descubre los servicios de QuanticoTrends en Facebook! Observa el rendimiento de tus sitios web, recopila información de empresas, construye relaciones con otros usuarios e incluso realiza un seguimiento de tus campañas. ¡Disfruta de las herramientas que necesitas para hacer la transición a la realidad virtual! #QuanticoTrends #Marketing #Sostenibilidad
67
+
68
+ ¡Bienvenido a QuanticoTrends! Estamos dedicados al monitoreo de redes sociales para empresas y nuestro servicio al cliente. Nuestro monitoreo de redes sociales está diseñado para brindar a los usuarios la mejor experiencia, consejos y consejos para tomar decisiones inteligentes y productivas para nuestras empresas. ¡Únete a nosotros hoy para estar al día con las tendencias de QuanticoTrends!
69
+
70
+ ¡Aprovecha nuestra especialidad de monitoreo de redes sociales para empresas! Regístrate ahora y crea una nueva selección de servicios y recursos que se adaptan a tus intereses y necesidades. # QuanticoTrends #empresas # MonitoreoDe redes sociales #MantenteSeguro #Visibilidad
71
+ ```