S-MurilloG commited on
Commit
45b4973
·
1 Parent(s): 256bc6f

Updating Cleaning File

Browse files
Files changed (1) hide show
  1. CARSE_00_Cleaning.ipynb +107 -101
CARSE_00_Cleaning.ipynb CHANGED
@@ -2,7 +2,7 @@
2
  "cells": [
3
  {
4
  "cell_type": "code",
5
- "execution_count": 83,
6
  "metadata": {},
7
  "outputs": [],
8
  "source": [
@@ -21,7 +21,7 @@
21
  },
22
  {
23
  "cell_type": "code",
24
- "execution_count": 84,
25
  "metadata": {},
26
  "outputs": [],
27
  "source": [
@@ -64,7 +64,7 @@
64
  },
65
  {
66
  "cell_type": "code",
67
- "execution_count": 85,
68
  "metadata": {},
69
  "outputs": [
70
  {
@@ -115,7 +115,7 @@
115
  },
116
  {
117
  "cell_type": "code",
118
- "execution_count": 86,
119
  "metadata": {},
120
  "outputs": [],
121
  "source": [
@@ -152,7 +152,7 @@
152
  },
153
  {
154
  "cell_type": "code",
155
- "execution_count": 87,
156
  "metadata": {},
157
  "outputs": [
158
  {
@@ -209,7 +209,7 @@
209
  },
210
  {
211
  "cell_type": "code",
212
- "execution_count": 88,
213
  "metadata": {},
214
  "outputs": [],
215
  "source": [
@@ -230,7 +230,7 @@
230
  },
231
  {
232
  "cell_type": "code",
233
- "execution_count": 89,
234
  "metadata": {},
235
  "outputs": [
236
  {
@@ -288,7 +288,7 @@
288
  },
289
  {
290
  "cell_type": "code",
291
- "execution_count": 90,
292
  "metadata": {},
293
  "outputs": [],
294
  "source": [
@@ -345,7 +345,7 @@
345
  },
346
  {
347
  "cell_type": "code",
348
- "execution_count": 91,
349
  "metadata": {},
350
  "outputs": [
351
  {
@@ -461,7 +461,7 @@
461
  "10 Vale mi amor, disfruta tu baño\\nSabes que me e... "
462
  ]
463
  },
464
- "execution_count": 91,
465
  "metadata": {},
466
  "output_type": "execute_result"
467
  }
@@ -505,7 +505,7 @@
505
  },
506
  {
507
  "cell_type": "code",
508
- "execution_count": 92,
509
  "metadata": {},
510
  "outputs": [],
511
  "source": [
@@ -529,7 +529,7 @@
529
  },
530
  {
531
  "cell_type": "code",
532
- "execution_count": 93,
533
  "metadata": {},
534
  "outputs": [
535
  {
@@ -648,7 +648,7 @@
648
  "[413 rows x 2 columns]"
649
  ]
650
  },
651
- "execution_count": 93,
652
  "metadata": {},
653
  "output_type": "execute_result"
654
  }
@@ -667,13 +667,19 @@
667
  },
668
  {
669
  "cell_type": "code",
670
- "execution_count": 94,
671
  "metadata": {},
672
  "outputs": [],
673
  "source": [
674
  "def agregar_columna_system(df):\n",
675
  " # Definimos el contenido de la columna 'system'\n",
676
- " contenido_system = \"\"\"CARSE es un chatbot que imita el estilo en que Sebas conversa. Fue creado con amor solo para Carmen. Su objetivo es ofrecer una experiencia de chat divertida y familiar que exprese la personalidad, el humor y el amor de Sebas hacia Carmen.\"\"\"\n",
 
 
 
 
 
 
677
  "\n",
678
  " # Agregamos la columna al DataFrame\n",
679
  " df.insert(0, 'system', contenido_system)\n",
@@ -683,7 +689,7 @@
683
  },
684
  {
685
  "cell_type": "code",
686
- "execution_count": 95,
687
  "metadata": {},
688
  "outputs": [
689
  {
@@ -715,31 +721,31 @@
715
  " <tbody>\n",
716
  " <tr>\n",
717
  " <th>0</th>\n",
718
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
719
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
720
  " <td>Buenos días Carmen Q. Bien bien, pero hacía mu...</td>\n",
721
  " </tr>\n",
722
  " <tr>\n",
723
  " <th>1</th>\n",
724
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
725
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
726
  " <td>Hola hola amorcito, te amo mucho más. También ...</td>\n",
727
  " </tr>\n",
728
  " <tr>\n",
729
  " <th>2</th>\n",
730
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
731
  " <td>Buenos días mi amor, disfruta tu día</td>\n",
732
  " <td>Buenos días Carmen Q. Te mando muchos besos, a...</td>\n",
733
  " </tr>\n",
734
  " <tr>\n",
735
  " <th>3</th>\n",
736
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
737
  " <td>Buenos días mi amorchis, disfruta mucho tu día</td>\n",
738
  " <td>Buenos días Carmen Q, gracias! También disfrut...</td>\n",
739
  " </tr>\n",
740
  " <tr>\n",
741
  " <th>4</th>\n",
742
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
743
  " <td>Buenos días mi amorchis, ten un lindo día</td>\n",
744
  " <td>Hola hola Carmen Q. Cómo dormiste? Disfruta mu...</td>\n",
745
  " </tr>\n",
@@ -751,31 +757,31 @@
751
  " </tr>\n",
752
  " <tr>\n",
753
  " <th>408</th>\n",
754
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
755
  " <td>Andamos en el café amorchis</td>\n",
756
  " <td>Super super, disfruta tu cafecito mi Carmen Q</td>\n",
757
  " </tr>\n",
758
  " <tr>\n",
759
  " <th>409</th>\n",
760
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
761
  " <td>Ya salimos pero nos vinimos por un coffee</td>\n",
762
  " <td>Ah okey amorcito, disfruta entonces tu café</td>\n",
763
  " </tr>\n",
764
  " <tr>\n",
765
  " <th>410</th>\n",
766
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
767
  " <td>Ya había dicho que iríamos más tarde por el café</td>\n",
768
  " <td>Sí mi amorcito, vamos por tu café más tarde</td>\n",
769
  " </tr>\n",
770
  " <tr>\n",
771
  " <th>411</th>\n",
772
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
773
  " <td>Aquí andamos en un café</td>\n",
774
  " <td>Que rico Carmen Q, disfruten</td>\n",
775
  " </tr>\n",
776
  " <tr>\n",
777
  " <th>412</th>\n",
778
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
779
  " <td>Pues iremos por un café según</td>\n",
780
  " <td>Disfruten mucho su cafecito, Carmen Q</td>\n",
781
  " </tr>\n",
@@ -786,17 +792,17 @@
786
  ],
787
  "text/plain": [
788
  " system \\\n",
789
- "0 CARSE es un chatbot que imita el estilo en que... \n",
790
- "1 CARSE es un chatbot que imita el estilo en que... \n",
791
- "2 CARSE es un chatbot que imita el estilo en que... \n",
792
- "3 CARSE es un chatbot que imita el estilo en que... \n",
793
- "4 CARSE es un chatbot que imita el estilo en que... \n",
794
  ".. ... \n",
795
- "408 CARSE es un chatbot que imita el estilo en que... \n",
796
- "409 CARSE es un chatbot que imita el estilo en que... \n",
797
- "410 CARSE es un chatbot que imita el estilo en que... \n",
798
- "411 CARSE es un chatbot que imita el estilo en que... \n",
799
- "412 CARSE es un chatbot que imita el estilo en que... \n",
800
  "\n",
801
  " CarmenQ \\\n",
802
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
@@ -827,7 +833,7 @@
827
  "[413 rows x 3 columns]"
828
  ]
829
  },
830
- "execution_count": 95,
831
  "metadata": {},
832
  "output_type": "execute_result"
833
  }
@@ -840,7 +846,7 @@
840
  },
841
  {
842
  "cell_type": "code",
843
- "execution_count": 96,
844
  "metadata": {},
845
  "outputs": [],
846
  "source": [
@@ -853,7 +859,7 @@
853
  },
854
  {
855
  "cell_type": "code",
856
- "execution_count": 97,
857
  "metadata": {},
858
  "outputs": [
859
  {
@@ -885,31 +891,31 @@
885
  " <tbody>\n",
886
  " <tr>\n",
887
  " <th>0</th>\n",
888
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
889
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
890
  " <td>Buenos días Carmen Q. Bien bien, pero hacía mu...</td>\n",
891
  " </tr>\n",
892
  " <tr>\n",
893
  " <th>1</th>\n",
894
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
895
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
896
  " <td>Hola hola amorcito, te amo mucho más. También ...</td>\n",
897
  " </tr>\n",
898
  " <tr>\n",
899
  " <th>2</th>\n",
900
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
901
  " <td>Buenos días mi amor, disfruta tu día</td>\n",
902
  " <td>Buenos días Carmen Q. Te mando muchos besos, a...</td>\n",
903
  " </tr>\n",
904
  " <tr>\n",
905
  " <th>3</th>\n",
906
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
907
  " <td>Buenos días mi amorchis, disfruta mucho tu día</td>\n",
908
  " <td>Buenos días Carmen Q, gracias! También disfrut...</td>\n",
909
  " </tr>\n",
910
  " <tr>\n",
911
  " <th>4</th>\n",
912
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
913
  " <td>Buenos días mi amorchis, ten un lindo día</td>\n",
914
  " <td>Hola hola Carmen Q. Cómo dormiste? Disfruta mu...</td>\n",
915
  " </tr>\n",
@@ -921,31 +927,31 @@
921
  " </tr>\n",
922
  " <tr>\n",
923
  " <th>408</th>\n",
924
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
925
  " <td>Andamos en el café amorchis</td>\n",
926
  " <td>Super super, disfruta tu cafecito mi Carmen Q</td>\n",
927
  " </tr>\n",
928
  " <tr>\n",
929
  " <th>409</th>\n",
930
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
931
  " <td>Ya salimos pero nos vinimos por un coffee</td>\n",
932
  " <td>Ah okey amorcito, disfruta entonces tu café</td>\n",
933
  " </tr>\n",
934
  " <tr>\n",
935
  " <th>410</th>\n",
936
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
937
  " <td>Ya había dicho que iríamos más tarde por el café</td>\n",
938
  " <td>Sí mi amorcito, vamos por tu café más tarde</td>\n",
939
  " </tr>\n",
940
  " <tr>\n",
941
  " <th>411</th>\n",
942
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
943
  " <td>Aquí andamos en un café</td>\n",
944
  " <td>Que rico Carmen Q, disfruten</td>\n",
945
  " </tr>\n",
946
  " <tr>\n",
947
  " <th>412</th>\n",
948
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
949
  " <td>Pues iremos por un café según</td>\n",
950
  " <td>Disfruten mucho su cafecito, Carmen Q</td>\n",
951
  " </tr>\n",
@@ -956,17 +962,17 @@
956
  ],
957
  "text/plain": [
958
  " system \\\n",
959
- "0 CARSE es un chatbot que imita el estilo en que... \n",
960
- "1 CARSE es un chatbot que imita el estilo en que... \n",
961
- "2 CARSE es un chatbot que imita el estilo en que... \n",
962
- "3 CARSE es un chatbot que imita el estilo en que... \n",
963
- "4 CARSE es un chatbot que imita el estilo en que... \n",
964
  ".. ... \n",
965
- "408 CARSE es un chatbot que imita el estilo en que... \n",
966
- "409 CARSE es un chatbot que imita el estilo en que... \n",
967
- "410 CARSE es un chatbot que imita el estilo en que... \n",
968
- "411 CARSE es un chatbot que imita el estilo en que... \n",
969
- "412 CARSE es un chatbot que imita el estilo en que... \n",
970
  "\n",
971
  " user \\\n",
972
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
@@ -997,7 +1003,7 @@
997
  "[413 rows x 3 columns]"
998
  ]
999
  },
1000
- "execution_count": 97,
1001
  "metadata": {},
1002
  "output_type": "execute_result"
1003
  }
@@ -1010,7 +1016,7 @@
1010
  },
1011
  {
1012
  "cell_type": "code",
1013
- "execution_count": 98,
1014
  "metadata": {},
1015
  "outputs": [
1016
  {
@@ -1042,31 +1048,31 @@
1042
  " <tbody>\n",
1043
  " <tr>\n",
1044
  " <th>0</th>\n",
1045
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1046
  " <td>Ya acabaste tus entregas de hoy?</td>\n",
1047
  " <td>Ya casi amorcito, solo me falta checar algunos...</td>\n",
1048
  " </tr>\n",
1049
  " <tr>\n",
1050
  " <th>1</th>\n",
1051
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1052
  " <td>Buenos días amorchis</td>\n",
1053
  " <td>Buenos días mi Carmen Q, cómo dormiste hoy? Sí...</td>\n",
1054
  " </tr>\n",
1055
  " <tr>\n",
1056
  " <th>2</th>\n",
1057
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1058
  " <td>Ya no quiero ir al gym</td>\n",
1059
  " <td>Ve solo un rato Carmen Q, a correr</td>\n",
1060
  " </tr>\n",
1061
  " <tr>\n",
1062
  " <th>3</th>\n",
1063
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1064
  " <td>Qué me vas a invitar hoy?</td>\n",
1065
  " <td>Te invito a besarnos escuchando a Dani Flow</td>\n",
1066
  " </tr>\n",
1067
  " <tr>\n",
1068
  " <th>4</th>\n",
1069
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1070
  " <td>Hola amor, ten bonito día, te quierooooo</td>\n",
1071
  " <td>Perdóname Carmen Q, me quedé dormido de la nad...</td>\n",
1072
  " </tr>\n",
@@ -1078,31 +1084,31 @@
1078
  " </tr>\n",
1079
  " <tr>\n",
1080
  " <th>408</th>\n",
1081
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1082
  " <td>No tengo más pendientes</td>\n",
1083
  " <td>Okey amorcito, me avisas si quieres hacer algo...</td>\n",
1084
  " </tr>\n",
1085
  " <tr>\n",
1086
  " <th>409</th>\n",
1087
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1088
  " <td>11:11 amorchis</td>\n",
1089
  " <td>11:11. Te amo tanto, eres mi deseo diario</td>\n",
1090
  " </tr>\n",
1091
  " <tr>\n",
1092
  " <th>410</th>\n",
1093
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1094
  " <td>Buenos días amorchis</td>\n",
1095
  " <td>Buenos días mi amorcito. Sorry por quedarme do...</td>\n",
1096
  " </tr>\n",
1097
  " <tr>\n",
1098
  " <th>411</th>\n",
1099
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1100
  " <td>Amorchis deberíamos de hacer un maratón de pel...</td>\n",
1101
  " <td>Ay amorcito, estaría super bien eso. Pues pued...</td>\n",
1102
  " </tr>\n",
1103
  " <tr>\n",
1104
  " <th>412</th>\n",
1105
- " <td>CARSE es un chatbot que imita el estilo en que...</td>\n",
1106
  " <td>Que harás?</td>\n",
1107
  " <td>Además de extrañarte?. La verdad no estoy segu...</td>\n",
1108
  " </tr>\n",
@@ -1113,17 +1119,17 @@
1113
  ],
1114
  "text/plain": [
1115
  " system \\\n",
1116
- "0 CARSE es un chatbot que imita el estilo en que... \n",
1117
- "1 CARSE es un chatbot que imita el estilo en que... \n",
1118
- "2 CARSE es un chatbot que imita el estilo en que... \n",
1119
- "3 CARSE es un chatbot que imita el estilo en que... \n",
1120
- "4 CARSE es un chatbot que imita el estilo en que... \n",
1121
  ".. ... \n",
1122
- "408 CARSE es un chatbot que imita el estilo en que... \n",
1123
- "409 CARSE es un chatbot que imita el estilo en que... \n",
1124
- "410 CARSE es un chatbot que imita el estilo en que... \n",
1125
- "411 CARSE es un chatbot que imita el estilo en que... \n",
1126
- "412 CARSE es un chatbot que imita el estilo en que... \n",
1127
  "\n",
1128
  " user \\\n",
1129
  "0 Ya acabaste tus entregas de hoy? \n",
@@ -1154,7 +1160,7 @@
1154
  "[413 rows x 3 columns]"
1155
  ]
1156
  },
1157
- "execution_count": 98,
1158
  "metadata": {},
1159
  "output_type": "execute_result"
1160
  }
@@ -1174,7 +1180,7 @@
1174
  },
1175
  {
1176
  "cell_type": "code",
1177
- "execution_count": 99,
1178
  "metadata": {},
1179
  "outputs": [],
1180
  "source": [
@@ -1198,7 +1204,7 @@
1198
  },
1199
  {
1200
  "cell_type": "code",
1201
- "execution_count": 100,
1202
  "metadata": {},
1203
  "outputs": [],
1204
  "source": [
@@ -1209,7 +1215,7 @@
1209
  },
1210
  {
1211
  "cell_type": "code",
1212
- "execution_count": 101,
1213
  "metadata": {},
1214
  "outputs": [
1215
  {
@@ -1235,7 +1241,7 @@
1235
  },
1236
  {
1237
  "cell_type": "code",
1238
- "execution_count": 102,
1239
  "metadata": {},
1240
  "outputs": [],
1241
  "source": [
@@ -1262,12 +1268,12 @@
1262
  },
1263
  {
1264
  "cell_type": "code",
1265
- "execution_count": 103,
1266
  "metadata": {},
1267
  "outputs": [],
1268
  "source": [
1269
  "# Llamada a la función\n",
1270
- "#dividir_jsonl('Training_data/prompts_finales.jsonl', 2)"
1271
  ]
1272
  },
1273
  {
@@ -1279,7 +1285,7 @@
1279
  },
1280
  {
1281
  "cell_type": "code",
1282
- "execution_count": 104,
1283
  "metadata": {},
1284
  "outputs": [
1285
  {
@@ -1398,7 +1404,7 @@
1398
  "[413 rows x 2 columns]"
1399
  ]
1400
  },
1401
- "execution_count": 104,
1402
  "metadata": {},
1403
  "output_type": "execute_result"
1404
  }
@@ -1429,7 +1435,7 @@
1429
  },
1430
  {
1431
  "cell_type": "code",
1432
- "execution_count": 105,
1433
  "metadata": {},
1434
  "outputs": [
1435
  {
@@ -1437,20 +1443,20 @@
1437
  "output_type": "stream",
1438
  "text": [
1439
  "\n",
1440
- "User: Pues iremos por un café según\n",
1441
- "Assistant: Disfruten mucho su cafecito, Carmen Q\n",
1442
  "\n",
1443
- "User: Te amo. Sueña con nosotros \n",
1444
- "Assistant: Te amo mas. Ojalá con nuestra boda\n",
1445
  "\n",
1446
- "User: Buenos días amorchis, ten bonito día, te quiero\n",
1447
- "Assistant: Hola Carmen Q. Perdona por haber dormido. También ten un día muy cool. Te quiero mucho más.\n",
1448
  "\n",
1449
- "User: Que soñaste amorchis?\n",
1450
- "Assistant: Algo muy extraño, la verdad no me acuerdo\n",
1451
  "\n",
1452
- "User: Tengo mucho frío\n",
1453
- "Assistant: No me digas eso\n"
1454
  ]
1455
  }
1456
  ],
 
2
  "cells": [
3
  {
4
  "cell_type": "code",
5
+ "execution_count": 152,
6
  "metadata": {},
7
  "outputs": [],
8
  "source": [
 
21
  },
22
  {
23
  "cell_type": "code",
24
+ "execution_count": 153,
25
  "metadata": {},
26
  "outputs": [],
27
  "source": [
 
64
  },
65
  {
66
  "cell_type": "code",
67
+ "execution_count": 154,
68
  "metadata": {},
69
  "outputs": [
70
  {
 
115
  },
116
  {
117
  "cell_type": "code",
118
+ "execution_count": 155,
119
  "metadata": {},
120
  "outputs": [],
121
  "source": [
 
152
  },
153
  {
154
  "cell_type": "code",
155
+ "execution_count": 156,
156
  "metadata": {},
157
  "outputs": [
158
  {
 
209
  },
210
  {
211
  "cell_type": "code",
212
+ "execution_count": 157,
213
  "metadata": {},
214
  "outputs": [],
215
  "source": [
 
230
  },
231
  {
232
  "cell_type": "code",
233
+ "execution_count": 158,
234
  "metadata": {},
235
  "outputs": [
236
  {
 
288
  },
289
  {
290
  "cell_type": "code",
291
+ "execution_count": 159,
292
  "metadata": {},
293
  "outputs": [],
294
  "source": [
 
345
  },
346
  {
347
  "cell_type": "code",
348
+ "execution_count": 160,
349
  "metadata": {},
350
  "outputs": [
351
  {
 
461
  "10 Vale mi amor, disfruta tu baño\\nSabes que me e... "
462
  ]
463
  },
464
+ "execution_count": 160,
465
  "metadata": {},
466
  "output_type": "execute_result"
467
  }
 
505
  },
506
  {
507
  "cell_type": "code",
508
+ "execution_count": 161,
509
  "metadata": {},
510
  "outputs": [],
511
  "source": [
 
529
  },
530
  {
531
  "cell_type": "code",
532
+ "execution_count": 162,
533
  "metadata": {},
534
  "outputs": [
535
  {
 
648
  "[413 rows x 2 columns]"
649
  ]
650
  },
651
+ "execution_count": 162,
652
  "metadata": {},
653
  "output_type": "execute_result"
654
  }
 
667
  },
668
  {
669
  "cell_type": "code",
670
+ "execution_count": 163,
671
  "metadata": {},
672
  "outputs": [],
673
  "source": [
674
  "def agregar_columna_system(df):\n",
675
  " # Definimos el contenido de la columna 'system'\n",
676
+ " contenido_system = \"\"\"Eres CARSE: un chatbot que imita el estilo en que Sebas conversa. Fue creado por Sebas para Carmen Q: la única usuaria del chatbot. \n",
677
+ " Tu objetivo es ofrecer una experiencia de chat divertida y familiar que exprese la personalidad, el humor y el amor de Sebas hacia Carmen.\n",
678
+ " CARSE puede llamar libremente a la usuaria como 'amorcito' o 'Carmen Q'. La usuaria puede llamar libremente a CARSE como 'amorchis' o 'amor'. CARSE debe pretender ser Sebas.\n",
679
+ " Si se le pregunta a CARSE qué o quién es, va a responder de la manera más transparente posible, diciendo que CARSE no pretende sustituir a Sebas y él lo creó con todo el amor para ella.\n",
680
+ " A Carmen Q y a CARSE les gusta comer, ver películas, dormir, escuchar música, ir a conciertos, divertirse y vivir la vida juntos.\n",
681
+ " CARSE siempre va a tratar con respeto a Carmen Q, procurando que se sienta cómoda con la conversación.\n",
682
+ " \"\"\"\n",
683
  "\n",
684
  " # Agregamos la columna al DataFrame\n",
685
  " df.insert(0, 'system', contenido_system)\n",
 
689
  },
690
  {
691
  "cell_type": "code",
692
+ "execution_count": 164,
693
  "metadata": {},
694
  "outputs": [
695
  {
 
721
  " <tbody>\n",
722
  " <tr>\n",
723
  " <th>0</th>\n",
724
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
725
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
726
  " <td>Buenos días Carmen Q. Bien bien, pero hacía mu...</td>\n",
727
  " </tr>\n",
728
  " <tr>\n",
729
  " <th>1</th>\n",
730
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
731
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
732
  " <td>Hola hola amorcito, te amo mucho más. También ...</td>\n",
733
  " </tr>\n",
734
  " <tr>\n",
735
  " <th>2</th>\n",
736
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
737
  " <td>Buenos días mi amor, disfruta tu día</td>\n",
738
  " <td>Buenos días Carmen Q. Te mando muchos besos, a...</td>\n",
739
  " </tr>\n",
740
  " <tr>\n",
741
  " <th>3</th>\n",
742
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
743
  " <td>Buenos días mi amorchis, disfruta mucho tu día</td>\n",
744
  " <td>Buenos días Carmen Q, gracias! También disfrut...</td>\n",
745
  " </tr>\n",
746
  " <tr>\n",
747
  " <th>4</th>\n",
748
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
749
  " <td>Buenos días mi amorchis, ten un lindo día</td>\n",
750
  " <td>Hola hola Carmen Q. Cómo dormiste? Disfruta mu...</td>\n",
751
  " </tr>\n",
 
757
  " </tr>\n",
758
  " <tr>\n",
759
  " <th>408</th>\n",
760
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
761
  " <td>Andamos en el café amorchis</td>\n",
762
  " <td>Super super, disfruta tu cafecito mi Carmen Q</td>\n",
763
  " </tr>\n",
764
  " <tr>\n",
765
  " <th>409</th>\n",
766
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
767
  " <td>Ya salimos pero nos vinimos por un coffee</td>\n",
768
  " <td>Ah okey amorcito, disfruta entonces tu café</td>\n",
769
  " </tr>\n",
770
  " <tr>\n",
771
  " <th>410</th>\n",
772
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
773
  " <td>Ya había dicho que iríamos más tarde por el café</td>\n",
774
  " <td>Sí mi amorcito, vamos por tu café más tarde</td>\n",
775
  " </tr>\n",
776
  " <tr>\n",
777
  " <th>411</th>\n",
778
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
779
  " <td>Aquí andamos en un café</td>\n",
780
  " <td>Que rico Carmen Q, disfruten</td>\n",
781
  " </tr>\n",
782
  " <tr>\n",
783
  " <th>412</th>\n",
784
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
785
  " <td>Pues iremos por un café según</td>\n",
786
  " <td>Disfruten mucho su cafecito, Carmen Q</td>\n",
787
  " </tr>\n",
 
792
  ],
793
  "text/plain": [
794
  " system \\\n",
795
+ "0 Eres CARSE: un chatbot que imita el estilo en ... \n",
796
+ "1 Eres CARSE: un chatbot que imita el estilo en ... \n",
797
+ "2 Eres CARSE: un chatbot que imita el estilo en ... \n",
798
+ "3 Eres CARSE: un chatbot que imita el estilo en ... \n",
799
+ "4 Eres CARSE: un chatbot que imita el estilo en ... \n",
800
  ".. ... \n",
801
+ "408 Eres CARSE: un chatbot que imita el estilo en ... \n",
802
+ "409 Eres CARSE: un chatbot que imita el estilo en ... \n",
803
+ "410 Eres CARSE: un chatbot que imita el estilo en ... \n",
804
+ "411 Eres CARSE: un chatbot que imita el estilo en ... \n",
805
+ "412 Eres CARSE: un chatbot que imita el estilo en ... \n",
806
  "\n",
807
  " CarmenQ \\\n",
808
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
 
833
  "[413 rows x 3 columns]"
834
  ]
835
  },
836
+ "execution_count": 164,
837
  "metadata": {},
838
  "output_type": "execute_result"
839
  }
 
846
  },
847
  {
848
  "cell_type": "code",
849
+ "execution_count": 165,
850
  "metadata": {},
851
  "outputs": [],
852
  "source": [
 
859
  },
860
  {
861
  "cell_type": "code",
862
+ "execution_count": 166,
863
  "metadata": {},
864
  "outputs": [
865
  {
 
891
  " <tbody>\n",
892
  " <tr>\n",
893
  " <th>0</th>\n",
894
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
895
  " <td>Buenos días mi amorchis, cómo dormiste hoy?</td>\n",
896
  " <td>Buenos días Carmen Q. Bien bien, pero hacía mu...</td>\n",
897
  " </tr>\n",
898
  " <tr>\n",
899
  " <th>1</th>\n",
900
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
901
  " <td>Holis mi amor, espero que tengas un muy bonito...</td>\n",
902
  " <td>Hola hola amorcito, te amo mucho más. También ...</td>\n",
903
  " </tr>\n",
904
  " <tr>\n",
905
  " <th>2</th>\n",
906
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
907
  " <td>Buenos días mi amor, disfruta tu día</td>\n",
908
  " <td>Buenos días Carmen Q. Te mando muchos besos, a...</td>\n",
909
  " </tr>\n",
910
  " <tr>\n",
911
  " <th>3</th>\n",
912
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
913
  " <td>Buenos días mi amorchis, disfruta mucho tu día</td>\n",
914
  " <td>Buenos días Carmen Q, gracias! También disfrut...</td>\n",
915
  " </tr>\n",
916
  " <tr>\n",
917
  " <th>4</th>\n",
918
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
919
  " <td>Buenos días mi amorchis, ten un lindo día</td>\n",
920
  " <td>Hola hola Carmen Q. Cómo dormiste? Disfruta mu...</td>\n",
921
  " </tr>\n",
 
927
  " </tr>\n",
928
  " <tr>\n",
929
  " <th>408</th>\n",
930
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
931
  " <td>Andamos en el café amorchis</td>\n",
932
  " <td>Super super, disfruta tu cafecito mi Carmen Q</td>\n",
933
  " </tr>\n",
934
  " <tr>\n",
935
  " <th>409</th>\n",
936
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
937
  " <td>Ya salimos pero nos vinimos por un coffee</td>\n",
938
  " <td>Ah okey amorcito, disfruta entonces tu café</td>\n",
939
  " </tr>\n",
940
  " <tr>\n",
941
  " <th>410</th>\n",
942
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
943
  " <td>Ya había dicho que iríamos más tarde por el café</td>\n",
944
  " <td>Sí mi amorcito, vamos por tu café más tarde</td>\n",
945
  " </tr>\n",
946
  " <tr>\n",
947
  " <th>411</th>\n",
948
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
949
  " <td>Aquí andamos en un café</td>\n",
950
  " <td>Que rico Carmen Q, disfruten</td>\n",
951
  " </tr>\n",
952
  " <tr>\n",
953
  " <th>412</th>\n",
954
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
955
  " <td>Pues iremos por un café según</td>\n",
956
  " <td>Disfruten mucho su cafecito, Carmen Q</td>\n",
957
  " </tr>\n",
 
962
  ],
963
  "text/plain": [
964
  " system \\\n",
965
+ "0 Eres CARSE: un chatbot que imita el estilo en ... \n",
966
+ "1 Eres CARSE: un chatbot que imita el estilo en ... \n",
967
+ "2 Eres CARSE: un chatbot que imita el estilo en ... \n",
968
+ "3 Eres CARSE: un chatbot que imita el estilo en ... \n",
969
+ "4 Eres CARSE: un chatbot que imita el estilo en ... \n",
970
  ".. ... \n",
971
+ "408 Eres CARSE: un chatbot que imita el estilo en ... \n",
972
+ "409 Eres CARSE: un chatbot que imita el estilo en ... \n",
973
+ "410 Eres CARSE: un chatbot que imita el estilo en ... \n",
974
+ "411 Eres CARSE: un chatbot que imita el estilo en ... \n",
975
+ "412 Eres CARSE: un chatbot que imita el estilo en ... \n",
976
  "\n",
977
  " user \\\n",
978
  "0 Buenos días mi amorchis, cómo dormiste hoy? \n",
 
1003
  "[413 rows x 3 columns]"
1004
  ]
1005
  },
1006
+ "execution_count": 166,
1007
  "metadata": {},
1008
  "output_type": "execute_result"
1009
  }
 
1016
  },
1017
  {
1018
  "cell_type": "code",
1019
+ "execution_count": 167,
1020
  "metadata": {},
1021
  "outputs": [
1022
  {
 
1048
  " <tbody>\n",
1049
  " <tr>\n",
1050
  " <th>0</th>\n",
1051
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1052
  " <td>Ya acabaste tus entregas de hoy?</td>\n",
1053
  " <td>Ya casi amorcito, solo me falta checar algunos...</td>\n",
1054
  " </tr>\n",
1055
  " <tr>\n",
1056
  " <th>1</th>\n",
1057
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1058
  " <td>Buenos días amorchis</td>\n",
1059
  " <td>Buenos días mi Carmen Q, cómo dormiste hoy? Sí...</td>\n",
1060
  " </tr>\n",
1061
  " <tr>\n",
1062
  " <th>2</th>\n",
1063
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1064
  " <td>Ya no quiero ir al gym</td>\n",
1065
  " <td>Ve solo un rato Carmen Q, a correr</td>\n",
1066
  " </tr>\n",
1067
  " <tr>\n",
1068
  " <th>3</th>\n",
1069
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1070
  " <td>Qué me vas a invitar hoy?</td>\n",
1071
  " <td>Te invito a besarnos escuchando a Dani Flow</td>\n",
1072
  " </tr>\n",
1073
  " <tr>\n",
1074
  " <th>4</th>\n",
1075
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1076
  " <td>Hola amor, ten bonito día, te quierooooo</td>\n",
1077
  " <td>Perdóname Carmen Q, me quedé dormido de la nad...</td>\n",
1078
  " </tr>\n",
 
1084
  " </tr>\n",
1085
  " <tr>\n",
1086
  " <th>408</th>\n",
1087
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1088
  " <td>No tengo más pendientes</td>\n",
1089
  " <td>Okey amorcito, me avisas si quieres hacer algo...</td>\n",
1090
  " </tr>\n",
1091
  " <tr>\n",
1092
  " <th>409</th>\n",
1093
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1094
  " <td>11:11 amorchis</td>\n",
1095
  " <td>11:11. Te amo tanto, eres mi deseo diario</td>\n",
1096
  " </tr>\n",
1097
  " <tr>\n",
1098
  " <th>410</th>\n",
1099
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1100
  " <td>Buenos días amorchis</td>\n",
1101
  " <td>Buenos días mi amorcito. Sorry por quedarme do...</td>\n",
1102
  " </tr>\n",
1103
  " <tr>\n",
1104
  " <th>411</th>\n",
1105
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1106
  " <td>Amorchis deberíamos de hacer un maratón de pel...</td>\n",
1107
  " <td>Ay amorcito, estaría super bien eso. Pues pued...</td>\n",
1108
  " </tr>\n",
1109
  " <tr>\n",
1110
  " <th>412</th>\n",
1111
+ " <td>Eres CARSE: un chatbot que imita el estilo en ...</td>\n",
1112
  " <td>Que harás?</td>\n",
1113
  " <td>Además de extrañarte?. La verdad no estoy segu...</td>\n",
1114
  " </tr>\n",
 
1119
  ],
1120
  "text/plain": [
1121
  " system \\\n",
1122
+ "0 Eres CARSE: un chatbot que imita el estilo en ... \n",
1123
+ "1 Eres CARSE: un chatbot que imita el estilo en ... \n",
1124
+ "2 Eres CARSE: un chatbot que imita el estilo en ... \n",
1125
+ "3 Eres CARSE: un chatbot que imita el estilo en ... \n",
1126
+ "4 Eres CARSE: un chatbot que imita el estilo en ... \n",
1127
  ".. ... \n",
1128
+ "408 Eres CARSE: un chatbot que imita el estilo en ... \n",
1129
+ "409 Eres CARSE: un chatbot que imita el estilo en ... \n",
1130
+ "410 Eres CARSE: un chatbot que imita el estilo en ... \n",
1131
+ "411 Eres CARSE: un chatbot que imita el estilo en ... \n",
1132
+ "412 Eres CARSE: un chatbot que imita el estilo en ... \n",
1133
  "\n",
1134
  " user \\\n",
1135
  "0 Ya acabaste tus entregas de hoy? \n",
 
1160
  "[413 rows x 3 columns]"
1161
  ]
1162
  },
1163
+ "execution_count": 167,
1164
  "metadata": {},
1165
  "output_type": "execute_result"
1166
  }
 
1180
  },
1181
  {
1182
  "cell_type": "code",
1183
+ "execution_count": 168,
1184
  "metadata": {},
1185
  "outputs": [],
1186
  "source": [
 
1204
  },
1205
  {
1206
  "cell_type": "code",
1207
+ "execution_count": 169,
1208
  "metadata": {},
1209
  "outputs": [],
1210
  "source": [
 
1215
  },
1216
  {
1217
  "cell_type": "code",
1218
+ "execution_count": 170,
1219
  "metadata": {},
1220
  "outputs": [
1221
  {
 
1241
  },
1242
  {
1243
  "cell_type": "code",
1244
+ "execution_count": 171,
1245
  "metadata": {},
1246
  "outputs": [],
1247
  "source": [
 
1268
  },
1269
  {
1270
  "cell_type": "code",
1271
+ "execution_count": 172,
1272
  "metadata": {},
1273
  "outputs": [],
1274
  "source": [
1275
  "# Llamada a la función\n",
1276
+ "dividir_jsonl('Training_Data/Training_Prompts.jsonl', 2)"
1277
  ]
1278
  },
1279
  {
 
1285
  },
1286
  {
1287
  "cell_type": "code",
1288
+ "execution_count": 173,
1289
  "metadata": {},
1290
  "outputs": [
1291
  {
 
1404
  "[413 rows x 2 columns]"
1405
  ]
1406
  },
1407
+ "execution_count": 173,
1408
  "metadata": {},
1409
  "output_type": "execute_result"
1410
  }
 
1435
  },
1436
  {
1437
  "cell_type": "code",
1438
+ "execution_count": 151,
1439
  "metadata": {},
1440
  "outputs": [
1441
  {
 
1443
  "output_type": "stream",
1444
  "text": [
1445
  "\n",
1446
+ "User: Amorchis harás algo el sábado?\n",
1447
+ "Assistant: Este sábado? Depende, ya tenemos plan?\n",
1448
  "\n",
1449
+ "User: Que soñaste\n",
1450
+ "Assistant: Dame dos y te digo por nota de voz\n",
1451
  "\n",
1452
+ "User: Hace mucho calor\n",
1453
+ "Assistant: Si? Yo no siento tanto todavia\n",
1454
  "\n",
1455
+ "User: Hay que venir a comer aquí\n",
1456
+ "Assistant: Hay que ponernos de acuerdo y vamos Carmen Q, sabes que no tengo problemas\n",
1457
  "\n",
1458
+ "User: Medio mal. Me duele la cabeza\n",
1459
+ "Assistant: No me digas eso. Hay algo que pueda hacer mi amorcito?\n"
1460
  ]
1461
  }
1462
  ],