Spaces:

Manasa1
/

AI_Comedy_Show

Runtime error

App Files Files Community

Manasa1 commited on Oct 14, 2024

Commit

e395658

•

1 Parent(s): 3b60319

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -80

app.py CHANGED Viewed

@@ -7,37 +7,37 @@ import scipy.io.wavfile
 from TTS.api import TTS
 from moviepy.editor import CompositeVideoClip, ImageClip, AudioFileClip, concatenate_videoclips
 import os
-from groq import Groq
-from deepgram import Deepgram
-# Initialize Clients
-groq_client = Groq(api_key=os.environ.get("GROQ_API_KEY"))
-deepgram_client = Deepgram(api_key=os.environ.get("DEEGRAM_API_KEY"))
 # Use DistilGPT-2 for text generation
 script_generator = pipeline("text-generation", model="distilgpt2", truncation=True, max_length=100)
-# Use Whisper for text-to-speech
-tts = TTS(model_name="whisper", progress_bar=False, gpu=False)
-# Use MusicLM for music generation
-music_generator = pipeline("text-to-audio", model="musiclm", device="cpu")
 # Use Stable Diffusion for image generation
 image_generator = StableDiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-2-1-base", torch_dtype=torch.float32).to("cpu")
-# Generate Comedy Script using DistilGPT-2
 def generate_comedy_script(prompt):
     script = script_generator(prompt)[0]['generated_text']
     return script
-# Convert Text to Speech using Whisper
 def text_to_speech(script):
     output_audio = 'output.wav'
     tts.tts_to_file(text=script, file_path=output_audio)
     return output_audio
-# Create Images Using Stable Diffusion
 def create_images_from_script(script):
     lines = script.split('. ')
     image_paths = []
@@ -48,21 +48,6 @@ def create_images_from_script(script):
         image_paths.append(img_path)
     return image_paths
-# Generate Fun Music Track using MusicLM
-def generate_fun_music(prompt, output_music_file="fun_music.wav"):
-    # Generate music based on the prompt using MusicLM
-    response = music_generator(prompt)
-    # Extract audio and sampling rate from the response
-    audio_data = response["audio"]
-    sampling_rate = response["sampling_rate"]
-    # Save the generated music to a file
-    scipy.io.wavfile.write(output_music_file, rate=sampling_rate, data=audio_data)
-    return output_music_file
-# Create Video from Generated Images
 def generate_text_video(script):
     image_paths = create_images_from_script(script)
     clips = []
@@ -73,7 +58,6 @@ def generate_text_video(script):
     final_video.write_videofile("/tmp/final_video.mp4", fps=24)
     return "/tmp/final_video.mp4"
-# Combine Audio and Video
 def combine_audio_video(video_path, audio_path):
     video = VideoFileClip(video_path)
     audio = AudioFileClip(audio_path)
@@ -81,7 +65,6 @@ def combine_audio_video(video_path, audio_path):
     final_video.write_videofile("/tmp/final_comedy_video.mp4", fps=24)
     return "/tmp/final_comedy_video.mp4"
-# Main Function to Generate Comedy Animation
 def generate_comedy_and_animation(prompt):
     script = generate_comedy_script(prompt)
     audio_file = text_to_speech(script)
@@ -90,55 +73,6 @@ def generate_comedy_and_animation(prompt):
     final_video = combine_audio_video(video_file, fun_music)
     return script, audio_file, final_video
-# Generate Kids Content
-def generate_kids_content(theme):
-    music_file = generate_fun_music(theme, output_music_file="kids_music.wav")
-    clips = []
-    for i in range(5):
-        img = Image.new('RGB', (800, 400), color=(0, 0, 255))
-        d = ImageDraw.Draw(img)
-        fnt = ImageFont.load_default()
-        d.text((10, 180), f"Kids Music: {theme}", font=fnt, fill=(255, 255, 0))
-        frame_path = f'/tmp/kids_temp_{i}.png'
-        img.save(frame_path)
-        clips.append(ImageClip(frame_path).set_duration(1).set_position(('center', 'center')))
-    final_video = CompositeVideoClip(clips, size=(800, 400))
-    final_video = final_video.set_audio(AudioFileClip(music_file))
-    final_video.write_videofile("/tmp/kids_animation.mp4", fps=24)
-    return music_file, "/tmp/kids_animation.mp4"
-# Gradio Interface
-with gr.Blocks() as app:
-    gr.Markdown("## AI Comedy and Kids Content Generator")
-    # Comedy Animation Tab
-    with gr.Tab("Generate Comedy Animation"):
-        prompt_input = gr.Textbox(label="Comedy Prompt")
-        generate_btn = gr.Button("Generate Comedy Script and Animation")
-        comedy_script = gr.Textbox(label="Generated Script")
-        comedy_audio = gr.Audio(label="Generated Audio")
-        comedy_video = gr.Video(label="Generated Animation")
-        generate_btn.click(
-            generate_comedy_and_animation,
-            inputs=prompt_input,
-            outputs=[comedy_script, comedy_audio, comedy_video]
-        )
-    # Kids Music Animation Tab
-    with gr.Tab("Generate Kids Music Animation"):
-        theme_input = gr.Textbox(label="Kids Music Theme")
-        generate_music_btn = gr.Button("Generate Kids Music and Animation")
-        kids_music_audio = gr.Audio(label="Generated Music")
-        kids_music_video = gr.Video(label="Generated Kids Animation")
-        generate_music_btn.click(
-            generate_kids_content,
-            inputs=theme_input,
-            outputs=[kids_music_audio, kids_music_video]
-        )
-app.launch()

 from TTS.api import TTS
 from moviepy.editor import CompositeVideoClip, ImageClip, AudioFileClip, concatenate_videoclips
 import os
 # Use DistilGPT-2 for text generation
 script_generator = pipeline("text-generation", model="distilgpt2", truncation=True, max_length=100)
 # Use Stable Diffusion for image generation
 image_generator = StableDiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-2-1-base", torch_dtype=torch.float32).to("cpu")
+# Use Coqui TTS for text-to-speech
+tts = TTS(model_name="tts_models/en/ljspeech/tacotron2-DDC", progress_bar=False, gpu=False)
+# Placeholder for music generation
+def generate_fun_music(prompt, output_music_file="fun_music.wav"):
+    # Generate silence as placeholder
+    duration = 3  # seconds
+    sample_rate = 44100
+    silence = np.zeros(int(sample_rate * duration), dtype=np.int16)
+    scipy.io.wavfile.write(output_music_file, sample_rate, silence)
+    return output_music_file
 def generate_comedy_script(prompt):
     script = script_generator(prompt)[0]['generated_text']
     return script
 def text_to_speech(script):
     output_audio = 'output.wav'
     tts.tts_to_file(text=script, file_path=output_audio)
     return output_audio
 def create_images_from_script(script):
     lines = script.split('. ')
     image_paths = []
         image_paths.append(img_path)
     return image_paths
 def generate_text_video(script):
     image_paths = create_images_from_script(script)
     clips = []
     final_video.write_videofile("/tmp/final_video.mp4", fps=24)
     return "/tmp/final_video.mp4"
 def combine_audio_video(video_path, audio_path):
     video = VideoFileClip(video_path)
     audio = AudioFileClip(audio_path)
     final_video.write_videofile("/tmp/final_comedy_video.mp4", fps=24)
     return "/tmp/final_comedy_video.mp4"
 def generate_comedy_and_animation(prompt):
     script = generate_comedy_script(prompt)
     audio_file = text_to_speech(script)
     final_video = combine_audio_video(video_file, fun_music)
     return script, audio_file, final_video