Spaces:

KalbeDigitalLab
/

NutriGenMePE

Sleeping

App Files Files Community

firqaaa commited on Dec 18, 2023

Commit

2923846

•

1 Parent(s): 3f64d74

Update app.py

Browse files

Files changed (1) hide show

app.py +4 -4

app.py CHANGED Viewed

@@ -158,7 +158,7 @@ if uploaded_files:
                         chunkdf = []
                         for i, chunk in enumerate(text_chunk):
                             inp = chunk
-                            df = pd.DataFrame(literal_eval(str(json.dumps(tablex_chain.run(inp)[0])).replace("\'", "\"")), index=[0]).fillna('')
                             # df = pd.DataFrame(repair_json(tablex_chain.run(inp)[0]))
                             chunkdf.append(df)
@@ -193,7 +193,7 @@ if uploaded_files:
                                 loader = TextLoader(text_file_path)
                                 documents = loader.load()
                                 # split it into chunks
-                                text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200, separators=["\n\n", "\n",])
                                 docs = text_splitter.split_documents(documents)
                                 embeddings = OpenAIEmbeddings()
@@ -613,7 +613,7 @@ if uploaded_files:
                             chunkdf = []
                             for i, chunk in enumerate(text_chunk):
                                 inp = chunk
-                                df = pd.DataFrame(literal_eval(str(json.dumps(tablex_chain.run(inp)[0])).replace("\'", "\"")), index=[0]).fillna('')
                                 chunkdf.append(df)
                             concat = pd.concat(chunkdf, axis=0).reset_index().drop('index', axis=1).fillna('')
@@ -647,7 +647,7 @@ if uploaded_files:
                                     loader = TextLoader(text_file_path)
                                     documents = loader.load()
                                     # split it into chunks
-                                    text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200, separators=["\n\n", "\n",])
                                     docs = text_splitter.split_documents(documents)
                                     embeddings = OpenAIEmbeddings()

                         chunkdf = []
                         for i, chunk in enumerate(text_chunk):
                             inp = chunk
+                            df = pd.DataFrame(literal_eval(str(json.dumps(tablex_chain.run(inp)[0])).replace("\'", '\"')), index=[0]).fillna('')
                             # df = pd.DataFrame(repair_json(tablex_chain.run(inp)[0]))
                             chunkdf.append(df)
                                 loader = TextLoader(text_file_path)
                                 documents = loader.load()
                                 # split it into chunks
+                                text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200, separator="\n")
                                 docs = text_splitter.split_documents(documents)
                                 embeddings = OpenAIEmbeddings()
                             chunkdf = []
                             for i, chunk in enumerate(text_chunk):
                                 inp = chunk
+                                df = pd.DataFrame(literal_eval(str(json.dumps(tablex_chain.run(inp)[0])).replace("\'", '\"')), index=[0]).fillna('')
                                 chunkdf.append(df)
                             concat = pd.concat(chunkdf, axis=0).reset_index().drop('index', axis=1).fillna('')
                                     loader = TextLoader(text_file_path)
                                     documents = loader.load()
                                     # split it into chunks
+                                    text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200, separator="\n")
                                     docs = text_splitter.split_documents(documents)
                                     embeddings = OpenAIEmbeddings()