Spaces:

JunyiAcademy
/

vaitor2

Sleeping

youngtsai commited on Jan 16, 2024

Commit

938aee2

1 Parent(s): 3e13a5c

formatted_transcript

Files changed (1) hide show

app.py CHANGED Viewed

@@ -54,18 +54,21 @@ def process_youtube_link(link):
     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
     video_id = link.split("=")[-1]
     transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=['zh-TW'])
     # 基于逐字稿生成其他所需的输出
     questions = generate_questions(transcript)
     df_summarise = generate_df_summarise(transcript)
     # 确保返回与 UI 组件预期匹配的输出
     return questions[0] if len(questions) > 0 else "", \
             questions[1] if len(questions) > 1 else "", \
             questions[2] if len(questions) > 2 else "", \
             df_summarise, \
-            transcript
 def process_web_link(link):
     # 抓取和解析网页内容

     # 假设您已经获取了 YouTube 视频的逐字稿并存储在变量 `transcript` 中
     video_id = link.split("=")[-1]
     transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=['zh-TW'])
     # 基于逐字稿生成其他所需的输出
     questions = generate_questions(transcript)
     df_summarise = generate_df_summarise(transcript)
+    formatted_transcript = ""
+    for entry in transcript:
+        line = f"时间: {entry['start']} 秒, 持续: {entry['duration']} 秒, 文本: {entry['text']}\n"
+        formatted_transcript += line
     # 确保返回与 UI 组件预期匹配的输出
     return questions[0] if len(questions) > 0 else "", \
             questions[1] if len(questions) > 1 else "", \
             questions[2] if len(questions) > 2 else "", \
             df_summarise, \
+            formatted_transcript
 def process_web_link(link):
     # 抓取和解析网页内容