Spaces:

ofig
/

live-lm-critic

Runtime error

App Files Files Community

Olivia Figueira commited on May 30, 2022

Commit

37d028c

•

1 Parent(s): e3d0258

Added other LMs to demo

Browse files

Files changed (2) hide show

critic/critic.py +112 -20
requirements.txt +6 -3

critic/critic.py CHANGED Viewed

@@ -5,24 +5,19 @@ import hashlib
 import numpy as np
 from tqdm import tqdm
 from transformers import GPT2Tokenizer, GPT2Model, GPT2LMHeadModel
 import nltk
 nltk.download('punkt')
 sys.path.insert(0, '.')
 from critic.perturbations import get_local_neighbors_char_level, get_local_neighbors_word_level
 from utils.spacy_tokenizer import spacy_tokenize_gec
-model_name = 'gpt2'
-tokenizer = GPT2Tokenizer.from_pretrained(model_name)
-tokenizer.pad_token = tokenizer.eos_token
-model = GPT2LMHeadModel.from_pretrained(model_name)
-model.eval()
-#model.cuda()
-model.cpu()
-print (f'Loaded {model_name}')
-def get_gpt2_loss(input_ids, attention_mask, labels):
     with torch.no_grad():
         outputs = model(input_ids=input_ids, attention_mask=attention_mask, labels=labels)
         lm_logits = outputs[1] #[bsize, seqlen, vocab]
@@ -39,7 +34,7 @@ def get_gpt2_loss(input_ids, attention_mask, labels):
 MAX_LENGTH = 66
-def run_gpt2(sents, cuda=False, model_name=None):
     assert isinstance(sents, list)
     _sents = [tokenizer.bos_token + s for s in sents]
     inputs = tokenizer(_sents, return_tensors="pt", padding=True)
@@ -47,7 +42,7 @@ def run_gpt2(sents, cuda=False, model_name=None):
         return None
     if cuda:
         inputs = {k: v.cuda() for k, v in inputs.items()}
-    loss = get_gpt2_loss(input_ids=inputs['input_ids'], attention_mask=inputs['attention_mask'], labels=inputs['input_ids'])
     logps = - loss.detach().cpu()
     return logps
@@ -95,7 +90,7 @@ def gpt2_critic_char_level_only(sent, verbose=1, cuda=False, fp16=True, seed='au
     return is_good, float(logps[0]), counter_example
-def gpt2_critic(sent, verbose=1, cuda=False, fp16=True, seed='auto', n_samples=100, word_level_mode='refine'):
     return_string = []
     if seed == 'auto':
         seed = int(hashlib.md5(sent.encode()).hexdigest(), 16) % (2**32) #Seed must be between 0 and 2**32 - 1
@@ -116,9 +111,9 @@ def gpt2_critic(sent, verbose=1, cuda=False, fp16=True, seed='auto', n_samples=1
         sents = [orig_sent] + list(sent_perturbations_c.union(sent_perturbations_w))
         if fp16:
             with torch.cuda.amp.autocast():
-                logps = run_gpt2(sents, cuda)
         else:
-            logps = run_gpt2(sents, cuda)
         if logps is None:
             if verbose:
                 print ('Invalid input. Maybe the sentence is too long.')
@@ -147,11 +142,108 @@ def main():
     import streamlit as st
     st.subheader('Exploring Unsupervised Grammatical Error Correction with Transformer-Based Models')
     sent = st.text_input('Enter a sentence:', value="")
     if sent != '':
-        st.markdown(f"**Sentence**: {sent}")
-        _,_,_,return_string = gpt2_critic(sent)
-        st.markdown("**Results:**")
-        st.write('\n'.join(return_string))
 if __name__ == '__main__':
     main()

 import numpy as np
 from tqdm import tqdm
 from transformers import GPT2Tokenizer, GPT2Model, GPT2LMHeadModel
+from transformers import OPTForCausalLM, GPTNeoForCausalLM
+from transformers import RobertaTokenizer, RobertaForCausalLM, RobertaConfig
+from transformers import XLMRobertaTokenizer, XLMRobertaForCausalLM, XLMRobertaConfig
+from transformers import BartTokenizer, BartForCausalLM
 import nltk
+import pandas as pd
 nltk.download('punkt')
 sys.path.insert(0, '.')
 from critic.perturbations import get_local_neighbors_char_level, get_local_neighbors_word_level
 from utils.spacy_tokenizer import spacy_tokenize_gec
+def get_gpt2_loss(model, tokenizer, input_ids, attention_mask, labels):
     with torch.no_grad():
         outputs = model(input_ids=input_ids, attention_mask=attention_mask, labels=labels)
         lm_logits = outputs[1] #[bsize, seqlen, vocab]
 MAX_LENGTH = 66
+def run_gpt2(sents, model, tokenizer, cuda=False, model_name=None):
     assert isinstance(sents, list)
     _sents = [tokenizer.bos_token + s for s in sents]
     inputs = tokenizer(_sents, return_tensors="pt", padding=True)
         return None
     if cuda:
         inputs = {k: v.cuda() for k, v in inputs.items()}
+    loss = get_gpt2_loss(model, tokenizer, input_ids=inputs['input_ids'], attention_mask=inputs['attention_mask'], labels=inputs['input_ids'])
     logps = - loss.detach().cpu()
     return logps
     return is_good, float(logps[0]), counter_example
+def gpt2_critic(sent, model, tokenizer, verbose=1, cuda=False, fp16=True, seed='auto', n_samples=100, word_level_mode='refine'):
     return_string = []
     if seed == 'auto':
         seed = int(hashlib.md5(sent.encode()).hexdigest(), 16) % (2**32) #Seed must be between 0 and 2**32 - 1
         sents = [orig_sent] + list(sent_perturbations_c.union(sent_perturbations_w))
         if fp16:
             with torch.cuda.amp.autocast():
+                logps = run_gpt2(sents, model, tokenizer, cuda)
         else:
+            logps = run_gpt2(sents, model, tokenizer, cuda)
         if logps is None:
             if verbose:
                 print ('Invalid input. Maybe the sentence is too long.')
     import streamlit as st
     st.subheader('Exploring Unsupervised Grammatical Error Correction with Transformer-Based Models')
     sent = st.text_input('Enter a sentence:', value="")
+    ### LMs we are trying:
     if sent != '':
+        st.markdown(f"**Input Sentence**: {sent}")
+        results = {}
+        with st.spinner('Running with GPT-2 LM...'):
+            ## GPT-2 LM (original LM-critic)
+            model_name = 'gpt2'
+            nice_name = "GPT-2"
+            tokenizer = GPT2Tokenizer.from_pretrained(model_name)
+            tokenizer.pad_token = tokenizer.eos_token
+            model = GPT2LMHeadModel.from_pretrained(model_name)
+            model.eval()
+            model.cpu()
+            is_good, score, counter_example, return_string_GPT2 = gpt2_critic(sent, model, tokenizer)
+        st.markdown("**Results with GPT-2 LM:**")
+        st.write('\n'.join(return_string_GPT2))
+        results[nice_name] = ["Good" if is_good else "Bad", str(round(score, 3)), "N/A" if not counter_example else str(counter_example[0]), "N/A" if not counter_example else str(round(counter_example[1], 3))]
+        with st.spinner('Running with OPT LM...'):
+            ## OPT LM
+            model_name = "facebook/opt-350m"
+            nice_name = "OPT"
+            model = OPTForCausalLM.from_pretrained("facebook/opt-350m")
+            tokenizer = GPT2Tokenizer.from_pretrained("facebook/opt-350m")
+            tokenizer.pad_token = tokenizer.eos_token
+            model.eval()
+            model.cpu()
+            is_good, score, counter_example, return_string_OPT = gpt2_critic(sent, model, tokenizer)
+        st.markdown("**Results with OPT LM:**")
+        st.write('\n'.join(return_string_OPT))
+        results[nice_name] = ["Good" if is_good else "Bad", str(round(score, 3)), "N/A" if not counter_example else str(counter_example[0]), "N/A" if not counter_example else str(round(counter_example[1], 3))]
+        with st.spinner('Running with GPT NEO LM...'):
+            ## GPT NEO
+            model_name = "EleutherAI/gpt-neo-1.3B"
+            nice_name = "GPT NEO"
+            model = GPTNeoForCausalLM.from_pretrained("EleutherAI/gpt-neo-1.3B")
+            tokenizer = GPT2Tokenizer.from_pretrained("EleutherAI/gpt-neo-1.3B")
+            tokenizer.pad_token = tokenizer.eos_token
+            model.eval()
+            model.cpu()
+            is_good, score, counter_example, return_string_GPTNEO = gpt2_critic(sent, model, tokenizer)
+        st.markdown("**Results with GPT NEO LM:**")
+        st.write('\n'.join(return_string_GPTNEO))
+        results[nice_name] = ["Good" if is_good else "Bad", str(round(score, 3)), "N/A" if not counter_example else str(counter_example[0]), "N/A" if not counter_example else str(round(counter_example[1], 3))]
+        with st.spinner('Running with RoBERTa LM...'):
+            ## RoBERTa
+            model_name = "roberta-base"
+            nice_name = "RoBERTa"
+            tokenizer = RobertaTokenizer.from_pretrained("roberta-base")
+            config = RobertaConfig.from_pretrained("roberta-base")
+            config.is_decoder = True
+            model = RobertaForCausalLM.from_pretrained("roberta-base", config=config)
+            tokenizer.pad_token = tokenizer.eos_token
+            model.eval()
+            model.cpu()
+            is_good, score, counter_example, return_string_RoBERTa = gpt2_critic(sent, model, tokenizer)
+        st.markdown("**Results with RoBERTa LM:**")
+        st.write('\n'.join(return_string_RoBERTa))
+        results[nice_name] = ["Good" if is_good else "Bad", str(round(score, 3)), "N/A" if not counter_example else str(counter_example[0]), "N/A" if not counter_example else str(round(counter_example[1], 3))]
+        with st.spinner('Running with BART LM...'):
+            ## RoBERTa
+            model_name = "facebook/bart-base"
+            nice_name = "BART"
+            tokenizer = BartTokenizer.from_pretrained("facebook/bart-base")
+            model = BartForCausalLM.from_pretrained("facebook/bart-base", add_cross_attention=False)
+            assert model.config.is_decoder, f"{model.__class__} has to be configured as a decoder."
+            tokenizer.pad_token = tokenizer.eos_token
+            model.eval()
+            model.cpu()
+            is_good, score, counter_example, return_string_BART = gpt2_critic(sent, model, tokenizer)
+        st.markdown("**Results with BART LM:**")
+        st.write('\n'.join(return_string_BART))
+        results[nice_name] = ["Good" if is_good else "Bad", str(round(score, 3)), "N/A" if not counter_example else str(counter_example[0]), "N/A" if not counter_example else str(round(counter_example[1], 3))]
+        with st.spinner('Running with XLM RoBERTa LM...'):
+            ## XLM RoBERTa
+            model_name = 'xlm-roberta-base'
+            nice_name = 'XLM RoBERTa'
+            tokenizer = XLMRobertaTokenizer.from_pretrained("xlm-roberta-base")
+            config = XLMRobertaConfig.from_pretrained("xlm-roberta-base")
+            config.is_decoder = True
+            model = XLMRobertaForCausalLM.from_pretrained("xlm-roberta-base", config=config)
+            tokenizer.pad_token = tokenizer.eos_token
+            model.eval()
+            model.cpu()
+            is_good, score, counter_example, return_string_XLMRoBERTa = gpt2_critic(sent, model, tokenizer)
+        st.markdown("**Results with XLM RoBERTa LM:**")
+        st.write('\n'.join(return_string_XLMRoBERTa))
+        results[nice_name] = ["Good" if is_good else "Bad", str(round(score, 3)), "N/A" if not counter_example else str(counter_example[0]), "N/A" if not counter_example else str(round(counter_example[1], 3))]
+        df = pd.DataFrame.from_dict(results,
+            orient = 'index',
+            columns=['Judgement', 'Score (log(p))', 'Neighbor sentence with highest score (log(p))', 'Neighbor sentence score (log(p))'])
+        st.markdown("**Tabular summary of results:**")
+        st.table(df)
+        st.write("Done.")
 if __name__ == '__main__':
     main()

requirements.txt CHANGED Viewed

@@ -1,9 +1,12 @@
-datasets==1.3.0
 editdistance==0.6.0
 nltk==3.7
 numpy==1.22.3
 spacy==3.0.5
 streamlit==1.9.0
 torch==1.11.0
-tqdm==4.49.0
-transformers==4.3.3

+datasets==2.2.2
 editdistance==0.6.0
 nltk==3.7
 numpy==1.22.3
 spacy==3.0.5
 streamlit==1.9.0
 torch==1.11.0
+tqdm==4.62.1
+transformers==4.19.2
+protobuf~=3.19.0
+sentencepiece==0.1.96
+huggingface-hub==0.1.0