video_bot_999

Sleeping

App Files Files Community

youngtsai commited on Feb 7

Commit

071ad69

•

1 Parent(s): e558eaf

summary = get_video_id_summary(video_id, formatted_simple_transcript)

Browse files

Files changed (1) hide show

app.py +25 -11

app.py CHANGED Viewed

@@ -316,8 +316,7 @@ def process_youtube_link(link):
     # questions = generate_questions(formatted_simple_transcript)
     questions = ["","",""]
     df_string_output = json.dumps(formatted_transcript, ensure_ascii=False, indent=2)
-    # df_summarise = generate_df_summarise(formatted_simple_transcript)
-    df_summarise = "..."
     global TRANSCRIPTS
     TRANSCRIPTS = formatted_transcript
@@ -330,7 +329,7 @@ def process_youtube_link(link):
             questions[1] if len(questions) > 1 else "", \
             questions[2] if len(questions) > 2 else "", \
             df_string_output, \
-            df_summarise, \
             html_content, \
             first_image, \
             first_text
@@ -375,14 +374,6 @@ def screenshot_youtube_video(youtube_id, snapshot_sec):
     return screenshot_path
-# def get_screenshot_from_video(video_link, start_time):
-#     # 实现从视频中提取帧的逻辑
-#     # 由于这需要服务器端处理，你可能需要一种方法来下载视频，
-#     # 并使用 ffmpeg 或类似工具提取特定时间点的帧
-#     # 这里只是一个示意性的函数实现
-#     screenshot_url = f"[逻辑以提取视频 {video_link} 在 {start_time} 秒时的截图]"
-#     return screenshot_url
 def process_web_link(link):
     # 抓取和解析网页内容
     response = requests.get(link)
@@ -390,6 +381,28 @@ def process_web_link(link):
     return soup.get_text()
 def generate_df_summarise(df_string):
     # 使用 OpenAI 生成基于上传数据的问题
     sys_content = "你是一個擅長資料分析跟影片教學的老師，user 為學生，請精讀資料文本，自行判斷資料的種類，使用 zh-TW"
@@ -434,6 +447,7 @@ def generate_df_summarise(df_string):
     return df_summarise
 def generate_questions(df_string):
     # 使用 OpenAI 生成基于上传数据的问题

     # questions = generate_questions(formatted_simple_transcript)
     questions = ["","",""]
     df_string_output = json.dumps(formatted_transcript, ensure_ascii=False, indent=2)
+    summary = get_video_id_summary(video_id, formatted_simple_transcript)
     global TRANSCRIPTS
     TRANSCRIPTS = formatted_transcript
             questions[1] if len(questions) > 1 else "", \
             questions[2] if len(questions) > 2 else "", \
             df_string_output, \
+            summary, \
             html_content, \
             first_image, \
             first_text
     return screenshot_path
 def process_web_link(link):
     # 抓取和解析网页内容
     response = requests.get(link)
     return soup.get_text()
+# get video_id_summary.json content
+def get_video_id_summary(video_id, df_string):
+    service = init_drive_service()
+    parent_folder_id = '1GgI4YVs0KckwStVQkLa1NZ8IpaEMurkL'
+    folder_id = create_folder_if_not_exists(service, video_id, parent_folder_id)
+    file_name = f'{video_id}_summary.json'
+    # 检查逐字稿是否存在
+    exists, file_id = check_file_exists(service, folder_id, file_name)
+    if not exists:
+        summary = generate_df_summarise(df_string)
+        file_id = upload_content_directly(service, file_name, folder_id, summary)
+        print("summary已上传到Google Drive")
+    else:
+        # 逐字稿已存在，下载逐字稿内容
+        print("summary已存在于Google Drive中")
+        summary = download_file_as_string(service, file_id)
+    return summary
 def generate_df_summarise(df_string):
     # 使用 OpenAI 生成基于上传数据的问题
     sys_content = "你是一個擅長資料分析跟影片教學的老師，user 為學生，請精讀資料文本，自行判斷資料的種類，使用 zh-TW"
     return df_summarise
 def generate_questions(df_string):
     # 使用 OpenAI 生成基于上传数据的问题