Spaces:

Omartificial-Intelligence-Space
/

Kalemat

Sleeping

Omartificial-Intelligence-Space commited on Mar 29, 2024

Commit

ca4f672

verified ·

1 Parent(s): 15f62f3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,13 +1,20 @@
 import gradio as gr
 from transformers import AutoTokenizer
-# Define a function to tokenize text with a selected tokenizer
 def tokenize_text(text, tokenizer_name):
   tokenizer = AutoTokenizer.from_pretrained(tokenizer_name)
   tokenized_text = tokenizer.tokenize(text)
   input_ids = tokenizer.convert_tokens_to_ids(tokenized_text)
-  decoded_text = tokenizer.decode(input_ids)  # Decode the input IDs
-  return f"Tokenized Text: {tokenized_text}\nInput IDs: {input_ids}\nDecoded Text: {decoded_text}"
 # Define available tokenizers

 import gradio as gr
 from transformers import AutoTokenizer
+chart_html = gr.HTML(label="Token Frequency Chart")
+# Define a function to tokenize text and create visualization
 def tokenize_text(text, tokenizer_name):
   tokenizer = AutoTokenizer.from_pretrained(tokenizer_name)
   tokenized_text = tokenizer.tokenize(text)
   input_ids = tokenizer.convert_tokens_to_ids(tokenized_text)
+  decoded_text = tokenizer.decode(input_ids)
+  # Create visualization HTML
+  chart_html = create_token_frequency_chart(tokenized_text)
+  return f"Tokenized Text: {tokenized_text}\nInput IDs: {input_ids}\nDecoded Text: {decoded_text}", chart_html
 # Define available tokenizers