Spaces:
Running
Running
Update utils.py
Browse files
utils.py
CHANGED
@@ -117,52 +117,60 @@ documents = []
|
|
117 |
print(df.iloc[0])
|
118 |
print(df.columns)
|
119 |
|
120 |
-
for _, row in df.iterrows():
|
121 |
-
|
122 |
-
|
123 |
-
|
124 |
-
|
125 |
-
|
126 |
-
|
127 |
-
|
128 |
-
|
129 |
-
|
130 |
-
|
131 |
-
|
132 |
-
|
133 |
-
|
134 |
-
|
135 |
-
|
136 |
-
|
137 |
-
|
138 |
-
|
139 |
-
|
140 |
-
|
141 |
-
|
142 |
-
|
143 |
-
|
144 |
|
145 |
-
|
146 |
-
|
147 |
-
|
148 |
-
|
149 |
-
|
150 |
-
|
151 |
-
|
152 |
-
|
153 |
-
|
154 |
-
|
155 |
-
|
156 |
-
|
157 |
-
|
158 |
-
|
159 |
-
|
160 |
-
|
161 |
-
# Si des documents sont créés, construire l'index
|
162 |
-
if documents:
|
163 |
-
|
164 |
-
else:
|
165 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
166 |
|
167 |
from llama_index.core.vector_stores import (
|
168 |
MetadataFilter,
|
|
|
117 |
print(df.iloc[0])
|
118 |
print(df.columns)
|
119 |
|
120 |
+
# for _, row in df.iterrows():
|
121 |
+
# try:
|
122 |
+
# # Extraire les champs pertinents du dataframe
|
123 |
+
# item_text = row.get('Item Text', 'Texte indisponible')
|
124 |
+
# theme_title = row.get('Theme Title', '')
|
125 |
+
# sous_theme_title = row.get('SousTheme Title', '')
|
126 |
+
# liste_service_text = row.get('Liste Service Text', '')
|
127 |
+
# signataire = row.get('Signataire', 'Signataire inconnu')
|
128 |
+
# fonction = row.get('Fonction', '')
|
129 |
+
# suppleant = row.get('Suppleant', '')
|
130 |
+
# collectivite = row.get('Collectivite', '')
|
131 |
+
# date_debut = row.get('Date Debut', '')
|
132 |
+
# coordonnes = row.get('personneConcernee')
|
133 |
+
|
134 |
+
# # Construire le texte avec les champs spécifiés
|
135 |
+
# text = f"""
|
136 |
+
# item: {item_text},
|
137 |
+
# service: {liste_service_text},
|
138 |
+
# signataire: {signataire},
|
139 |
+
# fonction: {fonction},
|
140 |
+
# collectivité: {collectivite},
|
141 |
+
# suppléant: {suppleant}
|
142 |
+
# coordonnes: {coordonnes}
|
143 |
+
# """
|
144 |
|
145 |
+
# if suppleant:
|
146 |
+
# text += f", suppléant: {suppleant}"
|
147 |
+
|
148 |
+
# # Créer le document avec texte et seulement 'Direction DGA' dans les métadonnées
|
149 |
+
# document = Document(
|
150 |
+
# text=text,
|
151 |
+
# metadata={
|
152 |
+
# "Direction DGA": row.get('Direction DGA', 'Direction DGA inconnue'),
|
153 |
+
# "Min":row['Min'],
|
154 |
+
# "Max":row['Max'],
|
155 |
+
# }
|
156 |
+
# )
|
157 |
+
# documents.append(document)
|
158 |
+
# except Exception as e:
|
159 |
+
# print(f"Erreur lors du traitement de la ligne {row['Numero']}: {e}")
|
160 |
+
|
161 |
+
# # Si des documents sont créés, construire l'index
|
162 |
+
# if documents:
|
163 |
+
# index = VectorStoreIndex.from_documents(documents, show_progress=True)
|
164 |
+
# else:
|
165 |
+
# print("Aucun document valide n'a été généré.")
|
166 |
+
|
167 |
+
from llama_index.core import StorageContext, load_index_from_storage
|
168 |
+
|
169 |
+
# rebuild storage context
|
170 |
+
storage_context = StorageContext.from_defaults(persist_dir="store")
|
171 |
+
|
172 |
+
# load index
|
173 |
+
index = load_index_from_storage(storage_context)
|
174 |
|
175 |
from llama_index.core.vector_stores import (
|
176 |
MetadataFilter,
|