Spaces:

kusumakar
/

Image_Describer

Running

kusumakar commited on Jun 14, 2023

Commit

9dc2e90

•

1 Parent(s): 84d6084

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,8 +1,12 @@
-import openai
-openai.api_key = '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'
 import numpy as np
 from PIL import Image
 from transformers import AutoTokenizer, ViTFeatureExtractor, VisionEncoderDecoderModel, GPT2Tokenizer, GPT2LMHeadModel
 # Directory path to the saved model on Google Drive
 model = VisionEncoderDecoderModel.from_pretrained("nlpconnect/vit-gpt2-image-captioning")
@@ -18,23 +22,18 @@ def generate_captions(image):
     return generated_caption
 def generate_paragraph(caption):
-    prompt = "Generate a paragraph based on the following caption: " + caption
-    # Make the API call to GPT-3
-    response = openai.Completion.create(
-        engine='text-davinci-003',  # Specify the GPT-3 model
-        prompt=prompt,
-        max_tokens=200,  # Adjust the desired length of the generated text
-        n = 1,  # Set the number of completions to generate
-        stop=None,  # Specify an optional stop sequence
-        temperature=0.7  # Adjust the temperature for randomness (between 0 and 1)
-    )
-    # Extract the generated text from the API response
-    generated_text = response.choices[0].text.strip()
     return generated_text
 # create the Streamlit app
 def app():
     st.title('Image from your Side, Detailed description from my site')

 import numpy as np
 from PIL import Image
 from transformers import AutoTokenizer, ViTFeatureExtractor, VisionEncoderDecoderModel, GPT2Tokenizer, GPT2LMHeadModel
+import torch
+from transformers import BartTokenizer, BartForConditionalGeneration
+# Load pre-trained BART model and tokenizer
+tokenizer_2 = BartTokenizer.from_pretrained("facebook/bart-large-cnn")
+model_2 = BartForConditionalGeneration.from_pretrained("facebook/bart-large-cnn")
 # Directory path to the saved model on Google Drive
 model = VisionEncoderDecoderModel.from_pretrained("nlpconnect/vit-gpt2-image-captioning")
     return generated_caption
 def generate_paragraph(caption):
+    # Tokenize the caption
+    inputs = tokenizer_2([caption], max_length=1024, truncation=True, padding="longest", return_tensors="pt")
+    # Generate text
+    output = model_2.generate(inputs.input_ids, attention_mask=inputs.attention_mask, max_length=200, num_beams=4, length_penalty=2.0, early_stopping=True)
+    # Decode the generated output
+    generated_text = tokenizer_2.decode(output[0], skip_special_tokens=True)
     return generated_text
 # create the Streamlit app
 def app():
     st.title('Image from your Side, Detailed description from my site')