kheopss commited on
Commit
79006ff
1 Parent(s): 2424404

Update utils.py

Browse files
Files changed (1) hide show
  1. utils.py +53 -45
utils.py CHANGED
@@ -117,52 +117,60 @@ documents = []
117
  print(df.iloc[0])
118
  print(df.columns)
119
 
120
- for _, row in df.iterrows():
121
- try:
122
- # Extraire les champs pertinents du dataframe
123
- item_text = row.get('Item Text', 'Texte indisponible')
124
- theme_title = row.get('Theme Title', '')
125
- sous_theme_title = row.get('SousTheme Title', '')
126
- liste_service_text = row.get('Liste Service Text', '')
127
- signataire = row.get('Signataire', 'Signataire inconnu')
128
- fonction = row.get('Fonction', '')
129
- suppleant = row.get('Suppleant', '')
130
- collectivite = row.get('Collectivite', '')
131
- date_debut = row.get('Date Debut', '')
132
- coordonnes = row.get('personneConcernee')
133
-
134
- # Construire le texte avec les champs spécifiés
135
- text = f"""
136
- item: {item_text},
137
- service: {liste_service_text},
138
- signataire: {signataire},
139
- fonction: {fonction},
140
- collectivité: {collectivite},
141
- suppléant: {suppleant}
142
- coordonnes: {coordonnes}
143
- """
144
 
145
- if suppleant:
146
- text += f", suppléant: {suppleant}"
147
-
148
- # Créer le document avec texte et seulement 'Direction DGA' dans les métadonnées
149
- document = Document(
150
- text=text,
151
- metadata={
152
- "Direction DGA": row.get('Direction DGA', 'Direction DGA inconnue'),
153
- "Min":row['Min'],
154
- "Max":row['Max'],
155
- }
156
- )
157
- documents.append(document)
158
- except Exception as e:
159
- print(f"Erreur lors du traitement de la ligne {row['Numero']}: {e}")
160
-
161
- # Si des documents sont créés, construire l'index
162
- if documents:
163
- index = VectorStoreIndex.from_documents(documents, show_progress=True)
164
- else:
165
- print("Aucun document valide n'a été généré.")
 
 
 
 
 
 
 
 
166
 
167
  from llama_index.core.vector_stores import (
168
  MetadataFilter,
 
117
  print(df.iloc[0])
118
  print(df.columns)
119
 
120
+ # for _, row in df.iterrows():
121
+ # try:
122
+ # # Extraire les champs pertinents du dataframe
123
+ # item_text = row.get('Item Text', 'Texte indisponible')
124
+ # theme_title = row.get('Theme Title', '')
125
+ # sous_theme_title = row.get('SousTheme Title', '')
126
+ # liste_service_text = row.get('Liste Service Text', '')
127
+ # signataire = row.get('Signataire', 'Signataire inconnu')
128
+ # fonction = row.get('Fonction', '')
129
+ # suppleant = row.get('Suppleant', '')
130
+ # collectivite = row.get('Collectivite', '')
131
+ # date_debut = row.get('Date Debut', '')
132
+ # coordonnes = row.get('personneConcernee')
133
+
134
+ # # Construire le texte avec les champs spécifiés
135
+ # text = f"""
136
+ # item: {item_text},
137
+ # service: {liste_service_text},
138
+ # signataire: {signataire},
139
+ # fonction: {fonction},
140
+ # collectivité: {collectivite},
141
+ # suppléant: {suppleant}
142
+ # coordonnes: {coordonnes}
143
+ # """
144
 
145
+ # if suppleant:
146
+ # text += f", suppléant: {suppleant}"
147
+
148
+ # # Créer le document avec texte et seulement 'Direction DGA' dans les métadonnées
149
+ # document = Document(
150
+ # text=text,
151
+ # metadata={
152
+ # "Direction DGA": row.get('Direction DGA', 'Direction DGA inconnue'),
153
+ # "Min":row['Min'],
154
+ # "Max":row['Max'],
155
+ # }
156
+ # )
157
+ # documents.append(document)
158
+ # except Exception as e:
159
+ # print(f"Erreur lors du traitement de la ligne {row['Numero']}: {e}")
160
+
161
+ # # Si des documents sont créés, construire l'index
162
+ # if documents:
163
+ # index = VectorStoreIndex.from_documents(documents, show_progress=True)
164
+ # else:
165
+ # print("Aucun document valide n'a été généré.")
166
+
167
+ from llama_index.core import StorageContext, load_index_from_storage
168
+
169
+ # rebuild storage context
170
+ storage_context = StorageContext.from_defaults(persist_dir="store")
171
+
172
+ # load index
173
+ index = load_index_from_storage(storage_context)
174
 
175
  from llama_index.core.vector_stores import (
176
  MetadataFilter,