crscardellino
/

flisol-cba-martin-fierro

@@ -168,7 +168,7 @@
     "## ¿Qué es un \"Transformer\"?\n",
     "\n",
     "- Es una arquitectura de red neuronal que se presentó en el paper [\"Attention is All You Need\"](https://arxiv.org/abs/1706.03762).\n",
-    "- Existen variantes:\n",
     "    - Los modelos de traducción de secuencia a secuencia (e.g. el [Transformer](https://arxiv.org/abs/1706.03762) o el [T5](https://arxiv.org/abs/1910.10683)). Tienen codificador y decodificador. Sirven para tareas de transformación (e.g. traducción).\n",
     "    - Los modelos basados en el codificador (e.g. [BERT](https://arxiv.org/abs/1810.04805)). Sirven para buscar representaciones vectoriales (embeddings) del texto.\n",
     "    - Los modelos basados en el decodificador (e.g. [GPT](https://arxiv.org/abs/2005.14165)). Sirven para generación de texto.\n",
@@ -307,7 +307,7 @@
   },
   {
    "cell_type": "markdown",
-   "id": "6e6b4464",
    "metadata": {
     "slideshow": {
      "slide_type": "subslide"
@@ -320,11 +320,26 @@
     "- Actualmente es más un arte que una ciencia.\n",
     "    - **No existe el \"prompt engineering\" porque los modelos no son determinísticos.**\n",
     "- Depende muchísimo del modelo, la inicialización aleatoria (i.e. la suerte), la tarea que se busca resolver, entre otros factores.\n",
-    "- Siguiendo los ejemplos de [esta publicación](https://medium.com/@fractal.ai/create-conversational-agents-using-bloom-part-1-63a66e6321c0), y en vistas de armar un chatbot, buscaré definir 3 cosas:\n",
     "    - La \"identidad\", i.e. ¿Qué es?\n",
     "    - La \"intención\", i.e. ¿Qué hace?\n",
     "    - El \"comportamiento\", i.e. ¿Cómo lo hace?\n",
-    "- Además, se le pueden dar ejemplos concretos de cómo se espera que interactúe. Estos sirven a los LLMs para hacer lo que se conoce como \"Few Shot Learning\" (aunque no están \"aprendiendo\", los ejemplos sólo ayudan a mejorar el contexto."
    ]
   },
   {
@@ -333,7 +348,7 @@
    "id": "c1227c49",
    "metadata": {
     "slideshow": {
-     "slide_type": "subslide"
     }
    },
    "outputs": [],

     "## ¿Qué es un \"Transformer\"?\n",
     "\n",
     "- Es una arquitectura de red neuronal que se presentó en el paper [\"Attention is All You Need\"](https://arxiv.org/abs/1706.03762).\n",
+    "- Existen variantes, de acuerdo a que parte de la arquitectura usan:\n",
     "    - Los modelos de traducción de secuencia a secuencia (e.g. el [Transformer](https://arxiv.org/abs/1706.03762) o el [T5](https://arxiv.org/abs/1910.10683)). Tienen codificador y decodificador. Sirven para tareas de transformación (e.g. traducción).\n",
     "    - Los modelos basados en el codificador (e.g. [BERT](https://arxiv.org/abs/1810.04805)). Sirven para buscar representaciones vectoriales (embeddings) del texto.\n",
     "    - Los modelos basados en el decodificador (e.g. [GPT](https://arxiv.org/abs/2005.14165)). Sirven para generación de texto.\n",
   },
   {
    "cell_type": "markdown",
+   "id": "e89d104b",
    "metadata": {
     "slideshow": {
      "slide_type": "subslide"
     "- Actualmente es más un arte que una ciencia.\n",
     "    - **No existe el \"prompt engineering\" porque los modelos no son determinísticos.**\n",
     "- Depende muchísimo del modelo, la inicialización aleatoria (i.e. la suerte), la tarea que se busca resolver, entre otros factores.\n",
+    "- Algo bastante común es que se le den ejemplos concretos de cómo se espera que genere texto.\n",
+    "    - A esta práctica se le conoce como [\"Few Shot Learning\"](https://arxiv.org/abs/2005.14165), si bien el modelo no \"aprende\" sino que busca contextos similares a los vistos en los ejemplos."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "6e6b4464",
+   "metadata": {
+    "slideshow": {
+     "slide_type": "subslide"
+    }
+   },
+   "source": [
+    "### Ejemplo de PROMPT\n",
+    "\n",
+    "- Siguiendo los ejemplos de [esta publicación](https://medium.com/@fractal.ai/create-conversational-agents-using-bloom-part-1-63a66e6321c0), y en vistas de armar un chatbot, buscaré definir 4 cosas:\n",
     "    - La \"identidad\", i.e. ¿Qué es?\n",
     "    - La \"intención\", i.e. ¿Qué hace?\n",
     "    - El \"comportamiento\", i.e. ¿Cómo lo hace?\n",
+    "    - Además le daré pie a que continué una conversación (\"Few Shot Learning\")."
    ]
   },
   {
    "id": "c1227c49",
    "metadata": {
     "slideshow": {
+     "slide_type": "fragment"
     }
    },
    "outputs": [],