rajammanabrolu
/

gpt-4-chat

Inference Endpoints

Model card Files Files and versions Community

rajammanabrolu commited on Jan 30

Commit

eeec945

•

1 Parent(s): cd5239e

Update tiktoken.py

Files changed (1) hide show

tiktoken.py +1 -18

tiktoken.py CHANGED Viewed

@@ -3,7 +3,6 @@
 from functools import lru_cache
 from typing import Any, Dict, List, Optional, Tuple
-import torch
 from transformers import PreTrainedTokenizer
 DEFAULT_SYSTEM_PROMPT = """You are a helpful, respectful and honest assistant. Always answer as helpfully as possible."""
@@ -200,8 +199,6 @@ class TiktokenTokenizerWrapper(PreTrainedTokenizer):
             '{% endif %}'
             '{% if (add_generation_prompt == true and loop.last) %}'
             "{{ '\n' + '<|im_start|>' + 'assistant' + '\n' }}"
-            "{% elif (message['role'] == 'assistant') %}"
-            '{{ eos_token }}'
             '{% endif %}'
             '{% endfor %}')
         template = template.replace(
@@ -358,19 +355,5 @@ class TiktokenTokenizerWrapper(PreTrainedTokenizer):
         return self.add_tokens(actual_new_tokens, special_tokens=True)
-    def construct_logit_tensor(self, logprobs: Dict[str,
-                                                    float]) -> torch.Tensor:
-        """Construct tensor of shape (vocab_size,) mapping words to logprobs.
-        Args:
-            logprobs (Dict[str, float]): Dictionary mapping tokens to log probabilities assigned to them by the model.
-        """
-        tensor = torch.tensor([min(logprobs.values()) - 1] * (self.vocab_size))
-        for k in logprobs:
-            encoding = self(k)['input_ids']
-            idx = encoding[0]
-            tensor[idx] = logprobs[k]
-        return tensor
-TiktokenTokenizerWrapper.register_for_auto_class()

 from functools import lru_cache
 from typing import Any, Dict, List, Optional, Tuple
 from transformers import PreTrainedTokenizer
 DEFAULT_SYSTEM_PROMPT = """You are a helpful, respectful and honest assistant. Always answer as helpfully as possible."""
             '{% endif %}'
             '{% if (add_generation_prompt == true and loop.last) %}'
             "{{ '\n' + '<|im_start|>' + 'assistant' + '\n' }}"
             '{% endif %}'
             '{% endfor %}')
         template = template.replace(
         return self.add_tokens(actual_new_tokens, special_tokens=True)
+TiktokenTokenizerWrapper.register_for_auto_class()