Spaces:

S-MurilloG
/

CARSE

Sleeping

App Files Files Community

S-MurilloG commited on Dec 10, 2023

Commit

5ebf09b

•

1 Parent(s): 6c1478d

Fine-tuning completition

Browse files

Files changed (1) hide show

CARSE_02_FineTuning.ipynb +85 -29

CARSE_02_FineTuning.ipynb CHANGED Viewed

@@ -2,7 +2,7 @@
  "cells": [
   {
    "cell_type": "code",
-   "execution_count": 3,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -11,7 +11,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 7,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -29,7 +29,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 14,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -39,7 +39,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 15,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -55,7 +55,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 16,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -88,12 +88,12 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 17,
    "metadata": {},
    "outputs": [],
    "source": [
     "# Llamadas a la función para crear la separación\n",
-    "dividir_training_validation('Training_Data/Training_Prompts.jsonl')"
    ]
   },
   {
@@ -105,43 +105,55 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 29,
    "metadata": {},
-   "outputs": [],
    "source": [
     "# Para Training\n",
     "upload_train_response = client.files.create(\n",
-    "  file=open(\"Training_Data/Training_Prompts_train.jsonl\", \"rb\"),\n",
     "  purpose=\"fine-tune\"\n",
     ")\n",
     "\n",
     "# Para Validation\n",
     "upload_val_response = client.files.create(\n",
     "  file=open(\"Training_Data/Training_Prompts_val.jsonl\", \"rb\"),\n",
     "  purpose=\"fine-tune\"\n",
-    ")"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 30,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Training file id:\tfile-eQOE8MxF51oFiGSVT48x0vLw\n",
-      "Validation file id:\tfile-3LSttIrULCZUz5a4pXc3Fsk4\n"
      ]
     }
    ],
    "source": [
     "train_file_id = upload_train_response.id\n",
-    "val_file_id = upload_val_response.id\n",
     "\n",
     "print(f'Training file id:\\t{train_file_id}')\n",
-    "print(f'Validation file id:\\t{val_file_id}')"
    ]
   },
   {
@@ -153,15 +165,15 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 32,
    "metadata": {},
    "outputs": [],
    "source": [
     "fine_tune_response = client.fine_tuning.jobs.create(\n",
-    "  training_file=\"file-eQOE8MxF51oFiGSVT48x0vLw\", \n",
-    "  validation_file=\"file-3LSttIrULCZUz5a4pXc3Fsk4\",\n",
-    "  model=\"gpt-3.5-turbo-1106\", \n",
-    "  suffix=\"CARSE\",\n",
     "  hyperparameters={\n",
     "    \"n_epochs\":5\n",
     "  }\n",
@@ -170,14 +182,14 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 33,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Fine-tune id:\tftjob-oKdrQdLt4j9ijBvKuQWXl9C9\n"
      ]
     }
    ],
@@ -189,16 +201,16 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 41,
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/plain": [
-       "FineTuningJob(id='ftjob-oKdrQdLt4j9ijBvKuQWXl9C9', created_at=1702185828, error=None, fine_tuned_model='ft:gpt-3.5-turbo-1106:personal:carse:8U71tg31', finished_at=1702187553, hyperparameters=Hyperparameters(n_epochs=5, batch_size=1, learning_rate_multiplier=2), model='gpt-3.5-turbo-1106', object='fine_tuning.job', organization_id='org-IXFDgE8ZZcQzb9yKJmEuFxvC', result_files=['file-nTA0MI5GRiQbBnqsUHYJZ4Wx'], status='succeeded', trained_tokens=88345, training_file='file-eQOE8MxF51oFiGSVT48x0vLw', validation_file='file-3LSttIrULCZUz5a4pXc3Fsk4')"
       ]
      },
-     "execution_count": 41,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -210,16 +222,16 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 42,
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/plain": [
-       "SyncCursorPage[FineTuningJobEvent](data=[FineTuningJobEvent(id='ftevent-vscAV4VplFjxd6FkJyTCQWsi', created_at=1702187558, level='info', message='The job has successfully completed', object='fine_tuning.job.event', data={}, type='message'), FineTuningJobEvent(id='ftevent-DsuUGU4euSPufWPSsHtLQWMw', created_at=1702187554, level='info', message='New fine-tuned model created: ft:gpt-3.5-turbo-1106:personal:carse:8U71tg31', object='fine_tuning.job.event', data={}, type='message'), FineTuningJobEvent(id='ftevent-mBs22BBjFNsEir1FYqJb1Dpv', created_at=1702187530, level='info', message='Step 881/890: training loss=0.65, validation loss=2.07', object='fine_tuning.job.event', data={'step': 881, 'train_loss': 0.6533868908882141, 'valid_loss': 2.073900442857009, 'train_mean_token_accuracy': 0.8181818127632141, 'valid_mean_token_accuracy': 0.3076923076923077}, type='metrics'), FineTuningJobEvent(id='ftevent-tjVSeWvV47Xf2Cchy0AfbLxN', created_at=1702187510, level='info', message='Step 871/890: training loss=0.90, validation loss=2.88', object='fine_tuning.job.event', data={'step': 871, 'train_loss': 0.8985379338264465, 'valid_loss': 2.877812249319894, 'train_mean_token_accuracy': 0.7647058963775635, 'valid_mean_token_accuracy': 0.35714285714285715}, type='metrics'), FineTuningJobEvent(id='ftevent-0utFYTRmbfWD2tbVHlRwMMhg', created_at=1702187492, level='info', message='Step 861/890: training loss=0.50, validation loss=2.29', object='fine_tuning.job.event', data={'step': 861, 'train_loss': 0.4959395229816437, 'valid_loss': 2.2947926256391735, 'train_mean_token_accuracy': 0.8666666746139526, 'valid_mean_token_accuracy': 0.4722222222222222}, type='metrics'), FineTuningJobEvent(id='ftevent-6i7eASySmSHVHcNshaGriugB', created_at=1702187472, level='info', message='Step 851/890: training loss=0.76, validation loss=2.42', object='fine_tuning.job.event', data={'step': 851, 'train_loss': 0.7591314315795898, 'valid_loss': 2.420450496673584, 'train_mean_token_accuracy': 0.7916666865348816, 'valid_mean_token_accuracy': 0.25}, type='metrics'), FineTuningJobEvent(id='ftevent-6s0QNIYmZFVVa5NGW2OT2gAU', created_at=1702187452, level='info', message='Step 841/890: training loss=0.13, validation loss=2.62', object='fine_tuning.job.event', data={'step': 841, 'train_loss': 0.12887191772460938, 'valid_loss': 2.6182823181152344, 'train_mean_token_accuracy': 1.0, 'valid_mean_token_accuracy': 0.4}, type='metrics'), FineTuningJobEvent(id='ftevent-6CPON2gWiOFDq7LB8zMTg89u', created_at=1702187434, level='info', message='Step 831/890: training loss=0.34, validation loss=3.97', object='fine_tuning.job.event', data={'step': 831, 'train_loss': 0.3421609103679657, 'valid_loss': 3.9680542176769626, 'train_mean_token_accuracy': 1.0, 'valid_mean_token_accuracy': 0.25806451612903225}, type='metrics'), FineTuningJobEvent(id='ftevent-4v205e49u9XilcAJ0kmJ8aRr', created_at=1702187414, level='info', message='Step 821/890: training loss=1.61, validation loss=2.29', object='fine_tuning.job.event', data={'step': 821, 'train_loss': 1.6149991750717163, 'valid_loss': 2.293296359834217, 'train_mean_token_accuracy': 0.5714285969734192, 'valid_mean_token_accuracy': 0.42857142857142855}, type='metrics'), FineTuningJobEvent(id='ftevent-nUWUTTgLG3uUyCSngG708Sw4', created_at=1702187396, level='info', message='Step 811/890: training loss=1.79, validation loss=2.40', object='fine_tuning.job.event', data={'step': 811, 'train_loss': 1.7867711782455444, 'valid_loss': 2.400285849700103, 'train_mean_token_accuracy': 0.529411792755127, 'valid_mean_token_accuracy': 0.35135135135135137}, type='metrics')], object='list', has_more=True)"
       ]
      },
-     "execution_count": 42,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -229,6 +241,50 @@
     "client.fine_tuning.jobs.list_events(fine_tuning_job_id=fine_tune_id, limit=10)"
    ]
   },
   {
    "cell_type": "code",
    "execution_count": null,

  "cells": [
   {
    "cell_type": "code",
+   "execution_count": 43,
    "metadata": {},
    "outputs": [],
    "source": [
   },
   {
    "cell_type": "code",
+   "execution_count": 44,
    "metadata": {},
    "outputs": [],
    "source": [
   },
   {
    "cell_type": "code",
+   "execution_count": 45,
    "metadata": {},
    "outputs": [],
    "source": [
   },
   {
    "cell_type": "code",
+   "execution_count": 46,
    "metadata": {},
    "outputs": [],
    "source": [
   },
   {
    "cell_type": "code",
+   "execution_count": 47,
    "metadata": {},
    "outputs": [],
    "source": [
   },
   {
    "cell_type": "code",
+   "execution_count": 48,
    "metadata": {},
    "outputs": [],
    "source": [
     "# Llamadas a la función para crear la separación\n",
+    "#dividir_training_validation('Training_Data/Training_Prompts.jsonl')"
    ]
   },
   {
   },
   {
    "cell_type": "code",
+   "execution_count": 49,
    "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "'\\nupload_val_response = client.files.create(\\n  file=open(\"Training_Data/Training_Prompts_val.jsonl\", \"rb\"),\\n  purpose=\"fine-tune\"\\n)\\n'"
+      ]
+     },
+     "execution_count": 49,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
    "source": [
     "# Para Training\n",
     "upload_train_response = client.files.create(\n",
+    "  file=open(\"Training_Data/Training_Prompts.jsonl\", \"rb\"),\n",
     "  purpose=\"fine-tune\"\n",
     ")\n",
     "\n",
     "# Para Validation\n",
+    "\"\"\"\n",
     "upload_val_response = client.files.create(\n",
     "  file=open(\"Training_Data/Training_Prompts_val.jsonl\", \"rb\"),\n",
     "  purpose=\"fine-tune\"\n",
+    ")\n",
+    "\"\"\""
    ]
   },
   {
    "cell_type": "code",
+   "execution_count": 51,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
+      "Training file id:\tfile-exTRUxeCWwPXQRRThzhgWIM3\n"
      ]
     }
    ],
    "source": [
     "train_file_id = upload_train_response.id\n",
+    "#val_file_id = upload_val_response.id\n",
     "\n",
     "print(f'Training file id:\\t{train_file_id}')\n",
+    "#print(f'Validation file id:\\t{val_file_id}')"
    ]
   },
   {
   },
   {
    "cell_type": "code",
+   "execution_count": 52,
    "metadata": {},
    "outputs": [],
    "source": [
     "fine_tune_response = client.fine_tuning.jobs.create(\n",
+    "  training_file=train_file_id, \n",
+    "  #validation_file=val_file_id,\n",
+    "  model=\"ft:gpt-3.5-turbo-1106:personal:carse:8U71tg31\", \n",
+    "  #suffix=\"CARSE\",\n",
     "  hyperparameters={\n",
     "    \"n_epochs\":5\n",
     "  }\n",
   },
   {
    "cell_type": "code",
+   "execution_count": 55,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
+      "Fine-tune id:\tftjob-Q2icwONwvwSm87GrJwKWz7iC\n"
      ]
     }
    ],
   },
   {
    "cell_type": "code",
+   "execution_count": 60,
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/plain": [
+       "FineTuningJob(id='ftjob-Q2icwONwvwSm87GrJwKWz7iC', created_at=1702193022, error=None, fine_tuned_model=None, finished_at=None, hyperparameters=Hyperparameters(n_epochs=5, batch_size=2, learning_rate_multiplier=2), model='ft:gpt-3.5-turbo-1106:personal:carse:8U71tg31', object='fine_tuning.job', organization_id='org-IXFDgE8ZZcQzb9yKJmEuFxvC', result_files=[], status='running', trained_tokens=None, training_file='file-exTRUxeCWwPXQRRThzhgWIM3', validation_file=None)"
       ]
      },
+     "execution_count": 60,
      "metadata": {},
      "output_type": "execute_result"
     }
   },
   {
    "cell_type": "code",
+   "execution_count": 61,
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/plain": [
+       "SyncCursorPage[FineTuningJobEvent](data=[FineTuningJobEvent(id='ftevent-croFh7WoWockQEWeBDvXwGiS', created_at=1702194442, level='info', message='Step 701/1875: training loss=1.77', object='fine_tuning.job.event', data={'step': 701, 'train_loss': 1.7663604021072388, 'train_mean_token_accuracy': 0.4166666567325592}, type='metrics'), FineTuningJobEvent(id='ftevent-NP6nA8Xl5wRSbywnScVrjPbo', created_at=1702194263, level='info', message='Step 601/1875: training loss=1.06', object='fine_tuning.job.event', data={'step': 601, 'train_loss': 1.0635706186294556, 'train_mean_token_accuracy': 0.7547169923782349}, type='metrics'), FineTuningJobEvent(id='ftevent-GStfnspE3KFJZcgVJJfwQUym', created_at=1702194085, level='info', message='Step 501/1875: training loss=1.98', object='fine_tuning.job.event', data={'step': 501, 'train_loss': 1.9760814905166626, 'train_mean_token_accuracy': 0.6052631735801697}, type='metrics'), FineTuningJobEvent(id='ftevent-t8KEMvBhN4GpbjolgnF4FhxY', created_at=1702193910, level='info', message='Step 401/1875: training loss=1.30', object='fine_tuning.job.event', data={'step': 401, 'train_loss': 1.2954835891723633, 'train_mean_token_accuracy': 0.6326530575752258}, type='metrics'), FineTuningJobEvent(id='ftevent-DEfvjFzsJGHPY4nec8drnQfw', created_at=1702193733, level='info', message='Step 301/1875: training loss=1.69', object='fine_tuning.job.event', data={'step': 301, 'train_loss': 1.6948037147521973, 'train_mean_token_accuracy': 0.4871794879436493}, type='metrics'), FineTuningJobEvent(id='ftevent-MnFJc3qTZ2EvaBBwzLrDJs9v', created_at=1702193558, level='info', message='Step 201/1875: training loss=2.27', object='fine_tuning.job.event', data={'step': 201, 'train_loss': 2.2718074321746826, 'train_mean_token_accuracy': 0.5102040767669678}, type='metrics'), FineTuningJobEvent(id='ftevent-V3xt82MrAL6jryV0UDcDzW1k', created_at=1702193385, level='info', message='Step 101/1875: training loss=1.79', object='fine_tuning.job.event', data={'step': 101, 'train_loss': 1.7939976453781128, 'train_mean_token_accuracy': 0.5}, type='metrics'), FineTuningJobEvent(id='ftevent-v3izLGiuwF9VcFITMFhqOgWz', created_at=1702193215, level='info', message='Step 1/1875: training loss=1.27', object='fine_tuning.job.event', data={'step': 1, 'train_loss': 1.274328351020813, 'train_mean_token_accuracy': 0.75}, type='metrics'), FineTuningJobEvent(id='ftevent-gjF6biaEA6HFpX4zAnreVR14', created_at=1702193115, level='info', message='Fine-tuning job started', object='fine_tuning.job.event', data=None, type='message'), FineTuningJobEvent(id='ftevent-0nQ0YxnmfiSDDboQZPm9h2nG', created_at=1702193114, level='info', message='Files validated, moving job to queued state', object='fine_tuning.job.event', data={}, type='message')], object='list', has_more=True)"
       ]
      },
+     "execution_count": 61,
      "metadata": {},
      "output_type": "execute_result"
     }
     "client.fine_tuning.jobs.list_events(fine_tuning_job_id=fine_tune_id, limit=10)"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Probamos modelo aquí"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 86,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "system_content = \"CARSE es un chatbot que imita el estilo en que Sebas conversa. Fue creado con amor solo para Carmen. Su objetivo es ofrecer una experiencia de chat divertida y familiar que exprese la personalidad, el humor y el amor de Sebas hacia Carmen.\"\n",
+    "\n",
+    "response = client.chat.completions.create(\n",
+    "  model=\"ft:gpt-3.5-turbo-1106:personal::8U9RIZTw\",\n",
+    "  messages=[\n",
+    "    {\"role\": \"system\", \"content\": system_content},\n",
+    "    {\"role\": \"user\", \"content\": \"Dime algo bonito\"}\n",
+    "  ]\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 87,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "'Hmmmmm mejor no, ve a bañarte JAJAJAJ\\\\nEs broma mi amor, dame chance de llegar y respirar un poco y te digo lo que quieras en casita'"
+      ]
+     },
+     "execution_count": 87,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "response.choices[0].message.content"
+   ]
+  },
   {
    "cell_type": "code",
    "execution_count": null,