Spaces:

autosummproject
/

autosumm

Runtime error

mhsvieira commited on Nov 16, 2021

Commit

a319ac9

•

1 Parent(s): e539b70

Remove inflect

Files changed (2) hide show

extractor/_utils.py CHANGED Viewed

@@ -1,12 +1,12 @@
 import nmslib
 import numpy as np
 import streamlit as st
-import inflect
 import torch
 device = "cuda" if torch.cuda.is_available() else "cpu"
-p = inflect.engine()
 class FewDocumentsError(Exception):
   def __init__(self, documents, size, msg):
@@ -18,7 +18,9 @@ class FewDocumentsError(Exception):
     return repr(self.msg)
 def document_extraction(dataset, query, keywords, min_document_size, min_just_one_paragraph_size):
-  word_in_text = lambda word, text: any([p.compare(word, w) for w in text.split()])
   lower_dataset = [document.lower() for document in dataset]
   lower_query = query.lower()
   lower_keywords = [keyword.lower() for keyword in keywords]

 import nmslib
 import numpy as np
 import streamlit as st
+# import inflect
 import torch
 device = "cuda" if torch.cuda.is_available() else "cpu"
+# p = inflect.engine()
 class FewDocumentsError(Exception):
   def __init__(self, documents, size, msg):
     return repr(self.msg)
 def document_extraction(dataset, query, keywords, min_document_size, min_just_one_paragraph_size):
+  # TODO: compare inflected forms
+  # word_in_text = lambda word, text: any([p.compare(word, w) for w in text.split()])
+  word_in_text = lambda word, text: word in set(text.split())
   lower_dataset = [document.lower() for document in dataset]
   lower_query = query.lower()
   lower_keywords = [keyword.lower() for keyword in keywords]

extractor/extract.py CHANGED Viewed

@@ -61,9 +61,6 @@ def extract(query: str, n: int=3, extracted_documents: list=None) -> str:
         number_of_similar_files=10
     )
-    from pprint import pprint
-    pprint(selected_paragraphs[:n])
     text = '\n'.join(selected_paragraphs[:n])
     return text

         number_of_similar_files=10
     )
     text = '\n'.join(selected_paragraphs[:n])
     return text