Spaces:

miqueiascoutinho
/

gerador_historia

Sleeping

App Files Files Community

miqueiascoutinho commited on Jul 6, 2024

Commit

1b22cf8

1 Parent(s): 1f5f8f5

Gerador de histórias a partir de uma imagem

Browse files

Files changed (3) hide show

.gitignore +4 -0
app.py +95 -0
requirements.txt +3 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,4 @@

+.env
+*.jpg
+*.wav
+*.venv

app.py ADDED Viewed

	@@ -0,0 +1,95 @@

+from openai import OpenAI
+from dotenv import load_dotenv
+import requests
+import os
+import streamlit as st
+# Adicionar o contexto de execução as secrets configuradas no arquivo .env
+load_dotenv()
+def gerar_contexto_imagem(input_imagem):
+    api_url = "https://api-inference.huggingface.co/models/Salesforce/blip-image-captioning-large"
+    access_token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
+    headers = {"Authorization": f"Bearer {access_token}"}
+    with open(input_imagem, "rb") as f:
+        data = f.read()
+    response = requests.post(api_url, headers=headers, data=data).json()
+    return response[0]['generated_text']
+def traduzir_texto(texto):
+    client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
+    chat = client.chat.completions.create(
+        model="gpt-3.5-turbo-0125",
+        messages=[
+            {"role":"system", "content": "Traduza do inglês para o português"},
+            {"role": "user", "content": texto}
+        ])
+    return chat.choices[0].message.content
+def gerar_historia(contexto):
+    llm_provider = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
+    historia = llm_provider.chat.completions.create(
+        model='gpt-3.5-turbo-0125',
+        max_tokens=300,
+        temperature=0.85,
+        messages=[
+            {"role": "system", "content":"Dado o contexto do usuário, crie uma história no idioma PORTIGUÊS. O texto deve entre 150 e 200 caracteres"},
+            {"role": "user", "content": contexto}
+        ]
+    )
+    return historia.choices[0].message.content
+# text to speech
+def gerar_audio(texto):
+    audio_name = 'historia.wav'
+    api_url = "https://api-inference.huggingface.co/models/facebook/mms-tts-por"
+    access_token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
+    headers = {"Authorization": f"Bearer {access_token}"}
+    payload = {
+        "inputs": texto
+    }
+    response = requests.post(api_url, headers=headers, json=payload)
+    with open(audio_name, 'wb') as file:
+        file.write(response.content)
+    return audio_name
+# APP / Interface gráfica
+def main():
+    st.set_page_config(page_title="imagem para história em áudio")
+    st.header("Imagem para história em áudio")
+    upload_file = st.file_uploader("Selecione uma imagem", type="jpg")
+    if upload_file is not None:
+        print(upload_file)
+        imagem_data_bytes = upload_file.getvalue()
+        with open(upload_file.name, "wb") as file:
+            file.write(imagem_data_bytes)
+        st.image(upload_file, caption="Imagem / Fotografia", use_column_width=True)
+        contexto_em_ingles = gerar_contexto_imagem(upload_file.name)
+        contexto_traduzido = traduzir_texto(contexto_em_ingles)
+        historia = gerar_historia(contexto_traduzido)
+        historia_em_audio = gerar_audio(historia)
+        with st.expander("Contexto"):
+            st.write(contexto_traduzido)
+        with st.expander("Historia"):
+            st.write(historia)
+        st.audio(historia_em_audio)
+if __name__ == '__main__':
+    main()

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+python-dotenv==1.0.1
+openai==1.13.3
+streamlit==1.36.0