Spaces:

NPG
/

GPT-2_Instruct

Runtime error

NPG commited on Feb 9, 2023

Commit

24fb9f1

•

1 Parent(s): a1e9152

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,13 +2,14 @@
 #!pip install transformers gradio accelerate bitsandbytes sentencepiece
-import multiprocessing
 import torch
 from transformers import T5Tokenizer, T5ForConditionalGeneration
 import gradio as gr
 """#Code"""
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
 """##FP 16"""
@@ -19,7 +20,7 @@ model = T5ForConditionalGeneration.from_pretrained("google/flan-t5-xl", device_m
 """###Interface"""
 def generate(input_text, minimum_length, maximum_length, temperature, repetition_penalty):
-    input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to(dtype=torch.float16).to(device)
     outputs = model.generate(input_ids,
                             min_length=minimum_length,
                             max_new_tokens=maximum_length,

 #!pip install transformers gradio accelerate bitsandbytes sentencepiece
+#import multiprocessing
 import torch
 from transformers import T5Tokenizer, T5ForConditionalGeneration
 import gradio as gr
 """#Code"""
+torch.set_default_dtype(torch.float16)
 device = "cuda:0" if torch.cuda.is_available() else "cpu"
 """##FP 16"""
 """###Interface"""
 def generate(input_text, minimum_length, maximum_length, temperature, repetition_penalty):
+    input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to(dtype=torch.long).to(device)
     outputs = model.generate(input_ids,
                             min_length=minimum_length,
                             max_new_tokens=maximum_length,