Videobook_v1.5

Running

App Files Files Community

Warlord-K commited on Jul 4, 2023

Commit

99b9405

•

0 Parent(s):

Duplicate from Warlord-K/Videobook

Browse files

Files changed (7) hide show

.gitattributes +35 -0
.gitignore +1 -0
README.md +14 -0
Videobook/Videobook.py +73 -0
Videobook/__init__.py +1 -0
app.py +20 -0
requirements.txt +8 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ __pycache__

README.md ADDED Viewed

	@@ -0,0 +1,14 @@

+---
+title: Videobook
+emoji: 🌍
+colorFrom: purple
+colorTo: blue
+sdk: gradio
+sdk_version: 3.35.2
+app_file: app.py
+pinned: false
+license: apache-2.0
+duplicated_from: Warlord-K/Videobook
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

Videobook/Videobook.py ADDED Viewed

	@@ -0,0 +1,73 @@

+import os
+import cv2
+import numpy as np
+from gtts import gTTS
+from mutagen.mp3 import MP3
+import nltk
+import ffmpeg
+nltk.download('punkt')
+from nltk.tokenize import sent_tokenize
+from math import ceil
+from segmindapi import SD2_1, Kadinsky
+import gradio as gr
+class Videobook:
+  def get_sentences(self, story):
+    return sent_tokenize(story)
+  def generate_voice(self, story, sentences , path = 'tts.mp3'):
+    for i,n in enumerate(sentences):
+        tts=gTTS(n,lang='en')
+        tts.save('tts'+str(i)+'.mp3')
+    lgth=[]
+    for i in range(len(sentences)):
+        lgth.append(MP3('tts'+str(i)+'.mp3').info.length)
+        os.remove(os.path.join(os.getcwd(),'tts'+str(i)+'.mp3'))
+    tts=gTTS(story,lang='en')
+    tts.save(path)
+    return lgth
+  def generate_imgs(self, sentences, steps):
+    imgs = []
+    for sentence in sentences:
+      sentence = self.style + ' of ' + sentence + ', ' + self.tags
+      imgs.append(self.pipe.generate(sentence, num_inference_steps = steps))
+    return imgs
+  def addBuffer(self, imgs, lgth):
+    imgs_buff = []
+    for i,img in enumerate(imgs):
+      for j in range(ceil(lgth[i] * self.fps)):
+        imgs_buff.append(img)
+    return imgs_buff
+  def imgs_to_video(self, imgs, video_name='video.mp4'):
+    video_dims = (imgs[0].width, imgs[0].height)
+    fourcc = cv2.VideoWriter_fourcc(*'DIVX')
+    video = cv2.VideoWriter(video_name, fourcc, self.fps, video_dims)
+    for img in imgs:
+      tmp_img = img.copy()
+      video.write(cv2.cvtColor(np.array(tmp_img), cv2.COLOR_RGB2BGR))
+    video.release()
+  def make_video(self, imgs, lengths, video_name = "finished_video.mp4"):
+    self.imgs_to_video(self.addBuffer(imgs, lengths), 'test_video.mp4')
+    input_audio = ffmpeg.input(os.path.join(os.getcwd(),'tts.mp3'))
+    input_video = ffmpeg.input(os.path.join(os.getcwd(),'test_video.mp4'))
+    ffmpeg.concat(input_video, input_audio, v=1, a=1).output(video_name).run(overwrite_output=True)
+  def generate(self, story, api_key, fps, style, tags, model, steps):
+    self.fps = fps
+    self.style = style
+    self.tags = tags
+    if model == "Stable Diffusion v2.1":
+      self.pipe = SD2_1(api_key)
+    else:
+      self.pipe = Kadinsky(api_key)
+    sentences = self.get_sentences(story)
+    lengths = self.generate_voice(story, sentences)
+    images = self.generate_imgs(sentences, steps)
+    self.make_video(images, lengths)
+    return "finished_video.mp4"

Videobook/__init__.py ADDED Viewed

	@@ -0,0 +1 @@


1	+ from .Videobook import Videobook

app.py ADDED Viewed

	@@ -0,0 +1,20 @@

+from Videobook import Videobook
+import gradio as gr
+gen = Videobook()
+with gr.Blocks() as demo:
+  with gr.Row():
+    with gr.Column():
+      story = gr.inputs.Textbox(lines = 5, label = "Story")
+      api_key = gr.inputs.Textbox(label = "Segmind API Key")
+      tags = gr.inputs.Textbox(default = "high quality, 3d render", label = "Tags")
+      style = gr.Dropdown(["Cartoon", "Anime Style", "Realistic Image"], value = "Cartoon", label = "Style")
+      model = gr.Dropdown(["Stable Diffusion v2.1", "Kadinsky"], value = "Stable Diffusion v2.1", label = "Model")
+      with gr.Row():
+        steps = gr.Radio([25, 50], value = 50, label = "Steps")
+        fps = gr.Radio([10, 24, 60], value = 10, label = "FPS")
+    output = gr.outputs.Video()
+  run = gr.Button(label = "Generate Video")
+  run.click(gen.generate, inputs = [story, api_key, fps, style, tags, model, steps], outputs = output)
+demo.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+segmindapi
+gTTS
+mutagen
+nltk
+ffmpeg-python
+opencv-python
+numpy
+gradio