Spaces:

uzi007
/

whispertube

Sleeping

App Files Files Community

uzi007 commited on Sep 14, 2023

Commit

5dafd75

1 Parent(s): 2f8c531

Added Multiple User Requests Handling

Browse files

Files changed (3) hide show

main.py +61 -20
media_download.py +33 -15
transcription.py +1 -1

main.py CHANGED Viewed

@@ -1,40 +1,81 @@
 from media_download import *
 from transcription import *
 import uvicorn
-from fastapi import FastAPI
 app = FastAPI()
-output_folder = './Output'
-media_path = ''
 @app.get("/get_media_info")
-async def get_media_info(url: str):
     youtube_downloader = YoutubeDownloader(url, output_folder)
-    return youtube_downloader.get_media_info()
 @app.get("/download_media")
-async def download_media(url: str, media_type: str, media_format: str, media_quality: str):
-    youtube_downloader = YoutubeDownloader(url, output_folder)
-    media_path = youtube_downloader.download(media_type, media_format, media_quality)
-    if media_path:
-        status = 1
-    else:
-        status = 0
     return {"status": status}
 @app.get("/generate_transcript")
-async def generate_transcript(subtitle_format: str = 'srt', word_level: bool = True):
     stable_whisper_transcript = StableWhisper(media_path, output_folder, subtitle_format=subtitle_format, word_level=word_level)
     transcript = stable_whisper_transcript.generate_transcript()
-    youtube_transcript.save_transcript()
-    if transcript:
-        status = 1
-    else:
-        status = 0
-        transcript
     return {"status": status, "transcript": transcript}
 if __name__ == "__main__":
-    uvicorn.run(app, host="127.0.0.1", port=8000)

 from media_download import *
 from transcription import *
+import asyncio
 import uvicorn
+from fastapi import FastAPI, Request, Depends
 app = FastAPI()
+output_folder = 'Output'
+# Create a context variable to store the contexts for each user
+users_context = dict()
 @app.get("/get_media_info")
+async def get_media_info(request: Request, url: str):
+    # Getting User's IP
+    user_ip = request.client.host
+    # Getting User's Youtube Downloader
     youtube_downloader = YoutubeDownloader(url, output_folder)
+    # Getting Youtube Media Info
+    media_info = youtube_downloader.get_media_info()
+    # Storing Info in the context for this user's session
+    users_context[user_ip] = dict()
+    users_context[user_ip]['downloader'] = youtube_downloader
+    # users_context[user_ip]['media_info'] = media_info
+    users_context[user_ip]['url'] = url
+    return media_info
 @app.get("/download_media")
+async def download_media(request: Request, media_type: str, media_format: str, media_quality: str):
+    # Getting User's IP
+    user_ip = request.client.host
+    # Downloading Media for User
+    media_path = users_context[user_ip]['downloader'].download(media_type, media_format, media_quality)
+    # Storing Media Info in the context for this user's session
+    users_context[user_ip]['media_path'] = media_path
+    users_context[user_ip]['media_type'] = media_type
+    # Getting Status
+    status = 1 if media_path else 0
     return {"status": status}
 @app.get("/generate_transcript")
+async def generate_transcript(request: Request, subtitle_format: str = 'srt', word_level: bool = True):
+    # Getting User's IP
+    user_ip = request.client.host
+    # Retrieving the media_path from the context for this user's session
+    media_path = users_context[user_ip]['media_path']
+    # Checking if the media_type is Video, then extract it's audio
+    media_type = users_context[user_ip]['media_type']
+    if media_type == 'video':
+        media_path = users_context[user_ip]['downloader'].extract_audio(media_path)
+    # Whisper based transcription
     stable_whisper_transcript = StableWhisper(media_path, output_folder, subtitle_format=subtitle_format, word_level=word_level)
     transcript = stable_whisper_transcript.generate_transcript()
+    transcript_path = youtube_transcript.save_transcript()
+    # Getting Status
+    status = 1 if transcript else 0
     return {"status": status, "transcript": transcript}
 if __name__ == "__main__":
+    uvicorn.run(app, host="127.0.0.1", port=8000)

media_download.py CHANGED Viewed

@@ -16,7 +16,7 @@ class MediaDownloader(ABC):
     def __init__(self, url, output_path, start_time=None, end_time=None):
         self.url = url
-        self.output_path = output_path
         self.start_time = start_time
         self.end_time = end_time
         self.__create_output_dir()
@@ -204,17 +204,13 @@ class YoutubeDownloader(MediaDownloader):
             "-x", "--audio-format", audio_format,
             "--audio-quality",  quality,
             "-o", output_path,
-            url, "-q"
         ]
         # Running the command using Subprocess
         subprocess.run(command)
         return output_path
-#         stream = self.streams.filter(file_extension=audio_format, abr=audio_quality).first()
-#         print(stream)
-#         audio_path = stream.download(output_path=self.output_path, filename=f"{self.title}.{audio_format}")
-#         return audio_path
     def _download_video(self, video_format, video_quality):
         '''
@@ -366,12 +362,34 @@ class YoutubeDownloader(MediaDownloader):
             'formats': self.media_formats_dict
         }
         return media_info
-    def main(self):
-        # Getting the Required Media Formats
-        media_type, media_format, media_quality = self._select_media_format()
-        # Downloading the Media
-        output_path = self.download(media_type, media_format, media_quality)
-        return output_path

     def __init__(self, url, output_path, start_time=None, end_time=None):
         self.url = url
+        self.output_path = os.path.join(os.getcwd(), output_path)
         self.start_time = start_time
         self.end_time = end_time
         self.__create_output_dir()
             "-x", "--audio-format", audio_format,
             "--audio-quality",  quality,
             "-o", output_path,
+            self.url, "-q"
         ]
         # Running the command using Subprocess
         subprocess.run(command)
         return output_path
     def _download_video(self, video_format, video_quality):
         '''
             'formats': self.media_formats_dict
         }
         return media_info
+    @staticmethod
+    def extract_audio(video_path):
+        """
+        Extract audio from a video file (MP4 or WebM) and save it as an MP3 file using ffmpeg.
+        Args:
+            video_path (str): Path to the input video file.
+        Returns:
+            bool: True if extraction is successful, False otherwise.
+        """
+        try:
+            # Determine the file format (MP4 or WebM) based on the file extension
+            filename, extension = os.path.splitext(video_path)
+            # Extracted audio path
+            audio_path = filename + '.mp3'
+            # Choose the appropriate codec for the output audio format (MP3)
+            audio_codec = "libmp3lame" if extension.lower() in (".mp4", ".webm") else "mp3"
+            # Run the ffmpeg command to extract audio
+            subprocess.run(["ffmpeg", "-i", video_path, "-vn", "-acodec",
+                            audio_codec, audio_path, '-loglevel', 'quiet'], check=True)
+            return audio_path
+        except subprocess.CalledProcessError as e:
+            print(f"Error: {e}")

transcription.py CHANGED Viewed

@@ -25,7 +25,7 @@ class Transcription(ABC):
     def __init__(self, media_path, output_path, subtitle_format):
         self.media_path = media_path
-        self.output_path = output_path
         self.filename = os.path.splitext(media_path)[0]
         self.subtitle_format = subtitle_format

     def __init__(self, media_path, output_path, subtitle_format):
         self.media_path = media_path
+        self.output_path = os.path.join(os.getcwd(), output_path)
         self.filename = os.path.splitext(media_path)[0]
         self.subtitle_format = subtitle_format