togethercomputer
/

evo-1-131k-base

@@ -101,9 +101,9 @@ class ByteTokenizer(PreTrainedTokenizer):
             verbose=kwargs.get('verbose', True),
         )
-    def _batch_encode_plus(self, batch_text: List[str], **kwargs) -> BatchEncoding:
-        input_ids = [(self.byte_tokenize(text).tolist(), None) for text in batch_text]
         return self._batch_prepare_for_model(
             input_ids,

             verbose=kwargs.get('verbose', True),
         )
+    def _batch_encode_plus(self, batch_text_or_text_pairs: List[str], **kwargs) -> BatchEncoding:
+        input_ids = [(self.byte_tokenize(text).tolist(), None) for text in batch_text_or_text_pairs]
         return self._batch_prepare_for_model(
             input_ids,