Xenova
/

dbrx-instruct-tokenizer

Transformers.js

Inference Endpoints

Model card Files Files and versions Community

Xenova HF staff commited on Mar 28

Commit

f2253a2

•

1 Parent(s): 4ec0196

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -5,9 +5,9 @@ tags:
  - tokenizers
 ---
-# GPT-4 Tokenizer
-A 🤗-compatible version of the **GPT-4 tokenizer** (adapted from [openai/tiktoken](https://github.com/openai/tiktoken)). This means it can be used with Hugging Face libraries including [Transformers](https://github.com/huggingface/transformers), [Tokenizers](https://github.com/huggingface/tokenizers), and [Transformers.js](https://github.com/xenova/transformers.js).
 ## Example usage:
@@ -15,7 +15,7 @@ A 🤗-compatible version of the **GPT-4 tokenizer** (adapted from [openai/tikto
 ```py
 from transformers import GPT2TokenizerFast
-tokenizer = GPT2TokenizerFast.from_pretrained('Xenova/gpt-4')
 assert tokenizer.encode('hello world') == [15339, 1917]
 ```
@@ -23,6 +23,6 @@ assert tokenizer.encode('hello world') == [15339, 1917]
 ```js
 import { AutoTokenizer } from '@xenova/transformers';
-const tokenizer = await AutoTokenizer.from_pretrained('Xenova/gpt-4');
 const tokens = tokenizer.encode('hello world'); // [15339, 1917]
 ```

  - tokenizers
 ---
+# DBRX Instruct Tokenizer
+A 🤗-compatible version of the **DBRX Instruct** (adapted from [databricks/dbrx-instruct](https://huggingface.co/databricks/dbrx-instruct)). This means it can be used with Hugging Face libraries including [Transformers](https://github.com/huggingface/transformers), [Tokenizers](https://github.com/huggingface/tokenizers), and [Transformers.js](https://github.com/xenova/transformers.js).
 ## Example usage:
 ```py
 from transformers import GPT2TokenizerFast
+tokenizer = GPT2TokenizerFast.from_pretrained('Xenova/dbrx-instruct-tokenizer')
 assert tokenizer.encode('hello world') == [15339, 1917]
 ```
 ```js
 import { AutoTokenizer } from '@xenova/transformers';
+const tokenizer = await AutoTokenizer.from_pretrained('Xenova/dbrx-instruct-tokenizer');
 const tokens = tokenizer.encode('hello world'); // [15339, 1917]
 ```