Spaces:

Seetha
/

IMA-pipeline-streamlit

Sleeping

App Files Files Community

Seetha commited on Oct 27, 2023

Commit

a8a102c

1 Parent(s): 75bc6ff

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -8

app.py CHANGED Viewed

@@ -123,14 +123,14 @@ def main():
     result2 = re.sub(r'[^\w\s]','',result1)
     result.append(result2)
-  st.write("--- %s seconds ---" % (time.time() - start_time))
   tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased") #bert-base-uncased
   model_path = "checkpoint-2850"
   model = AutoModelForSequenceClassification.from_pretrained(model_path,id2label={0:'non-causal',1:'causal'})
-  st.write('sequence classification loaded')
   pipe1 = pipeline("text-classification", model=model,tokenizer=tokenizer)
   for sent in result:
     pred = pipe1(sent)
@@ -138,8 +138,8 @@ def main():
         if lab['label'] == 'causal': #causal
             causal_sents.append(sent)
-  st.write('causal sentence classification finished')
-  st.write("--- %s seconds ---" % (time.time() - start_time))
   model_name = "distilbert-base-cased"
   tokenizer = DistilBertTokenizerFast.from_pretrained(model_name,low_cpu_mem_usage=True)
@@ -161,8 +161,8 @@ def main():
       class_list.append(i['word'])
       entity_list.append(i['entity_group'])
-  st.write('causality extraction finished')
-  st.write("--- %s seconds ---" % (time.time() - start_time))
   # filename = 'Checkpoint-classification.sav'
   # loaded_model = pickle.load(open(filename, 'rb'))
@@ -190,8 +190,8 @@ def main():
   predictions = loaded_model.predict(pad_sequences(tokenizer.texts_to_sequences(class_list),maxlen=MAX_SEQUENCE_LENGTH))
   predicted = np.argmax(predictions,axis=1)
-  st.write('stakeholder taxonomy finished')
-  st.write("--- %s seconds ---" % (time.time() - start_time))
   pred1 = predicted
   level0 = []
   count =0

     result2 = re.sub(r'[^\w\s]','',result1)
     result.append(result2)
+  #st.write("--- %s seconds ---" % (time.time() - start_time))
   tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased") #bert-base-uncased
   model_path = "checkpoint-2850"
   model = AutoModelForSequenceClassification.from_pretrained(model_path,id2label={0:'non-causal',1:'causal'})
+  #st.write('sequence classification loaded')
   pipe1 = pipeline("text-classification", model=model,tokenizer=tokenizer)
   for sent in result:
     pred = pipe1(sent)
         if lab['label'] == 'causal': #causal
             causal_sents.append(sent)
+  # st.write('causal sentence classification finished')
+  # st.write("--- %s seconds ---" % (time.time() - start_time))
   model_name = "distilbert-base-cased"
   tokenizer = DistilBertTokenizerFast.from_pretrained(model_name,low_cpu_mem_usage=True)
       class_list.append(i['word'])
       entity_list.append(i['entity_group'])
+  # st.write('causality extraction finished')
+  # st.write("--- %s seconds ---" % (time.time() - start_time))
   # filename = 'Checkpoint-classification.sav'
   # loaded_model = pickle.load(open(filename, 'rb'))
   predictions = loaded_model.predict(pad_sequences(tokenizer.texts_to_sequences(class_list),maxlen=MAX_SEQUENCE_LENGTH))
   predicted = np.argmax(predictions,axis=1)
+  # st.write('stakeholder taxonomy finished')
+  # st.write("--- %s seconds ---" % (time.time() - start_time))
   pred1 = predicted
   level0 = []
   count =0