Spaces:

gorkemgoknar
/

moviechatbot

Running

gorkemgoknar commited on Nov 23, 2021

Commit

9136a7f

•

1 Parent(s): 9aa52b3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,19 +23,23 @@ SPECIAL_TOKENS = ["<bos>", "<eos>", "<speaker1>", "<speaker2>", "<pad>"]
 #See document for experiment https://www.linkedin.com/pulse/ai-goes-job-interview-g%C3%B6rkem-g%C3%B6knar/
 def get_chat_response(name,history=[], input_txt = "Hello , what is your name?"):
   ai_history = history.copy()
-  ai_history.append(input_txt)
   ai_history_e = [tokenizer.encode(e) for e in ai_history]
   personality = "My name is " + name
   bos, eos, speaker1, speaker2 = tokenizer.convert_tokens_to_ids(SPECIAL_TOKENS[:-1])
-  sequence = [[bos]  + tokenizer.encode(personality)] + ai_history_e
   sequence = [sequence[0]] + [[speaker2 if (len(sequence)-i) % 2 else speaker1] + s for i, s in enumerate(sequence[1:])]
   sequence = list(chain(*sequence))
   #bot_input_ids = tokenizer.encode(personality + tokenizer.eos_token + input_txt + tokenizer.eos_token  , return_tensors='pt')

 #See document for experiment https://www.linkedin.com/pulse/ai-goes-job-interview-g%C3%B6rkem-g%C3%B6knar/
 def get_chat_response(name,history=[], input_txt = "Hello , what is your name?"):
   ai_history = history.copy()
+  #ai_history.append(input_txt)
   ai_history_e = [tokenizer.encode(e) for e in ai_history]
   personality = "My name is " + name
   bos, eos, speaker1, speaker2 = tokenizer.convert_tokens_to_ids(SPECIAL_TOKENS[:-1])
+  #persona first, history next, input text must be at the end
+  #[[bos, persona] , [history] , [input]]
+  sequence = [[bos]  + tokenizer.encode(personality)] + ai_history_e  + [tokenizer.encode(input_txt)]
+  ##[[bos, persona] , [speaker1 .., speakser2 .., speaker1 ... speaker2 ... , [input]]
   sequence = [sequence[0]] + [[speaker2 if (len(sequence)-i) % 2 else speaker1] + s for i, s in enumerate(sequence[1:])]
   sequence = list(chain(*sequence))
   #bot_input_ids = tokenizer.encode(personality + tokenizer.eos_token + input_txt + tokenizer.eos_token  , return_tensors='pt')