Spaces:

jbilcke-hf
/

ai-tube-clap-exporter

Running on CPU Upgrade

App Files Files Community

jbilcke-hf HF staff commited on Apr 29, 2024

Commit

44b5f05

1 Parent(s): a73c130

try to do things in parallel

Browse files

Files changed (4) hide show

src/core/exporters/clapWithStoryboardsToVideoFile.mts +6 -92
src/core/exporters/clapWithVideosToVideoFile.mts +8 -82
src/core/exporters/storyboardSegmentToVideoFile.mts +103 -0
src/core/exporters/videoSegmentToVideoFile.mts +84 -0

src/core/exporters/clapWithStoryboardsToVideoFile.mts CHANGED Viewed

@@ -1,15 +1,7 @@
-import { join } from "node:path"
 import { ClapProject, ClapSegment } from "@aitube/clap"
-import { concatenateVideosWithAudio } from "../ffmpeg/concatenateVideosWithAudio.mts"
-import { writeBase64ToFile } from "../files/writeBase64ToFile.mts"
 import { getRandomDirectory } from "../files/getRandomDirectory.mts"
-import { addTextToVideo } from "../ffmpeg/addTextToVideo.mts"
-import { startOfSegment1IsWithinSegment2 } from "../utils/startOfSegment1IsWithinSegment2.mts"
-import { deleteFile } from "../files/deleteFile.mts"
-import { extractBase64 } from "../base64/extractBase64.mts"
-import { imageToVideoBase64 } from "../ffmpeg/imageToVideoBase64.mts"
 export async function clapWithStoryboardsToVideoFile({
   clap,
@@ -26,91 +18,13 @@ export async function clapWithStoryboardsToVideoFile({
   outputDir = outputDir || (await getRandomDirectory())
-  const videoFilePaths: string[] = []
-  for (const segment of storyboardSegments) {
-    let storyboardSegmentVideoFilePath = join(outputDir, `tmp_asset_${segment.id}_as_video.mp4`)
-    await imageToVideoBase64({
-      inputImageInBase64: segment.assetUrl,
-      outputFilePath: storyboardSegmentVideoFilePath,
-      width: clap.meta.width,
-      height: clap.meta.height,
-      outputVideoDurationInMs: 5000, // TODO this should be computed from the voice? or we can resize videos, toos
       outputDir,
-      clearOutputDirAtTheEnd: false, // <- must stay false or else we lose everything!
-      outputVideoFormat: "mp4",
     })
-    const interfaceSegments = clap.segments.filter(s =>
-      // nope, not all interfaces asset have the assetUrl
-      // although in the future.. we might want to
-      // s.assetUrl.startsWith("data:text/") &&
-      s.category === "interface" &&
-      startOfSegment1IsWithinSegment2(s, segment)
-    )
-    console.log(`clapWithStoryboardsToVideoFile: got ${interfaceSegments.length} interface segments for shot ${segment.id} [${segment.startTimeInMs}:${segment.endTimeInMs}]`)
-    const interfaceSegment = interfaceSegments.at(0)
-    if (interfaceSegment) {
-      // here we are free to use mp4, since this is an internal intermediary format
-      const videoSegmentWithOverlayFilePath = join(outputDir, `tmp_asset_${segment.id}_with_interface.mp4`)
-      await addTextToVideo({
-        inputVideoPath: storyboardSegmentVideoFilePath,
-        outputVideoPath: videoSegmentWithOverlayFilePath,
-        text: interfaceSegment.assetUrl.startsWith("data:text/")
-          ? atob(extractBase64(interfaceSegment.assetUrl).data)
-          : interfaceSegment.assetUrl,
-        width: clap.meta.width,
-        height: clap.meta.height,
-      })
-      // we overwrite
-      await deleteFile(storyboardSegmentVideoFilePath)
-      storyboardSegmentVideoFilePath = videoSegmentWithOverlayFilePath
-    }
-    const dialogueSegments = clap.segments.filter(s =>
-      s.assetUrl.startsWith("data:audio/") &&
-      s.category === "dialogue" &&
-      startOfSegment1IsWithinSegment2(s, segment)
-    )
-    console.log(`clapWithStoryboardsToVideoFile: got ${dialogueSegments.length} dialogue segments for shot ${segment.id} [${segment.startTimeInMs}:${segment.endTimeInMs}]`)
-    const dialogueSegment = dialogueSegments.at(0)
-    if (dialogueSegment) {
-      extractBase64(dialogueSegment.assetUrl)
-      const base64Info = extractBase64(dialogueSegment.assetUrl)
-      const dialogueSegmentFilePath = await writeBase64ToFile(
-        dialogueSegment.assetUrl,
-        join(outputDir, `tmp_asset_${segment.id}_dialogue.${base64Info.extension}`)
-      )
-      const finalFilePathOfVideoWithSound = await concatenateVideosWithAudio({
-        output: join(outputDir, `${segment.id}_video_with_audio.mp4`),
-        audioFilePath: dialogueSegmentFilePath,
-        videoFilePaths: [storyboardSegmentVideoFilePath],
-        // videos are silent, so they can stay at 0
-        videoTracksVolume: 0.0,
-        audioTrackVolume: 1.0,
-      })
-      // we delete the temporary dialogue file
-      await deleteFile(dialogueSegmentFilePath)
-      // we overwrite the video segment
-      await deleteFile(storyboardSegmentVideoFilePath)
-      storyboardSegmentVideoFilePath = finalFilePathOfVideoWithSound
-    }
-    videoFilePaths.push(storyboardSegmentVideoFilePath)
-  }
   // console.log(`clapWithStoryboardsToVideoFile: videoFilePaths: ${JSON.stringify(videoFilePaths, null, 2)}`)

 import { ClapProject, ClapSegment } from "@aitube/clap"
 import { getRandomDirectory } from "../files/getRandomDirectory.mts"
+import { storyboardSegmentToVideoFile } from "./storyboardSegmentToVideoFile.mts"
 export async function clapWithStoryboardsToVideoFile({
   clap,
   outputDir = outputDir || (await getRandomDirectory())
+  const videoFilePaths: string[] = await Promise.all(storyboardSegments.map(segment =>
+    storyboardSegmentToVideoFile({
+      clap,
+      segment,
       outputDir,
     })
+  ))
   // console.log(`clapWithStoryboardsToVideoFile: videoFilePaths: ${JSON.stringify(videoFilePaths, null, 2)}`)

src/core/exporters/clapWithVideosToVideoFile.mts CHANGED Viewed

@@ -1,14 +1,7 @@
-import { join } from "node:path"
 import { ClapProject, ClapSegment } from "@aitube/clap"
-import { concatenateVideosWithAudio } from "../ffmpeg/concatenateVideosWithAudio.mts"
-import { writeBase64ToFile } from "../files/writeBase64ToFile.mts"
 import { getRandomDirectory } from "../files/getRandomDirectory.mts"
-import { addTextToVideo } from "../ffmpeg/addTextToVideo.mts"
-import { startOfSegment1IsWithinSegment2 } from "../utils/startOfSegment1IsWithinSegment2.mts"
-import { deleteFile } from "../files/deleteFile.mts"
-import { extractBase64 } from "../base64/extractBase64.mts"
 export async function clapWithVideosToVideoFile({
@@ -26,80 +19,13 @@ export async function clapWithVideosToVideoFile({
   outputDir = outputDir || (await getRandomDirectory())
-  const videoFilePaths: string[] = []
-  for (const segment of videoSegments) {
-    const base64Info = extractBase64(segment.assetUrl)
-    // we write it to the disk *unconverted* (it might be a mp4, a webm or something else)
-    let videoSegmentFilePath = await writeBase64ToFile(
-      segment.assetUrl,
-      join(outputDir, `tmp_asset_${segment.id}.${base64Info.extension}`)
-    )
-    const interfaceSegments = clap.segments.filter(s =>
-      // nope, not all interfaces asset have the assetUrl
-      // although in the future.. we might want to
-      // s.assetUrl.startsWith("data:text/") &&
-      s.category === "interface" &&
-      startOfSegment1IsWithinSegment2(s, segment)
-    )
-    const interfaceSegment = interfaceSegments.at(0)
-    if (interfaceSegment) {
-      // here we are free to use mp4, since this is an internal intermediary format
-      const videoSegmentWithOverlayFilePath = join(outputDir, `tmp_asset_${segment.id}_with_interface.mp4`)
-      await addTextToVideo({
-        inputVideoPath: videoSegmentFilePath,
-        outputVideoPath: videoSegmentWithOverlayFilePath,
-        text: interfaceSegment.assetUrl.startsWith("data:text/")
-          ? atob(extractBase64(interfaceSegment.assetUrl).data)
-          : interfaceSegment.assetUrl,
-        width: clap.meta.width,
-        height: clap.meta.height,
-      })
-      // we overwrite
-      await deleteFile(videoSegmentFilePath)
-      videoSegmentFilePath = videoSegmentWithOverlayFilePath
-    }
-    const dialogueSegments = clap.segments.filter(s =>
-      s.assetUrl.startsWith("data:audio/") &&
-      s.category === "dialogue" &&
-      startOfSegment1IsWithinSegment2(s, segment)
-    )
-    const dialogueSegment = dialogueSegments.at(0)
-    if (dialogueSegment) {
-      extractBase64(dialogueSegment.assetUrl)
-      const base64Info = extractBase64(dialogueSegment.assetUrl)
-      const dialogueSegmentFilePath = await writeBase64ToFile(
-        dialogueSegment.assetUrl,
-        join(outputDir, `tmp_asset_${segment.id}_dialogue.${base64Info.extension}`)
-      )
-      const finalFilePathOfVideoWithSound = await concatenateVideosWithAudio({
-        output: join(outputDir, `${segment.id}_video_with_audio.mp4`),
-        audioFilePath: dialogueSegmentFilePath,
-        videoFilePaths: [videoSegmentFilePath],
-        // videos are silent, so they can stay at 0
-        videoTracksVolume: 0.0,
-        audioTrackVolume: 1.0,
-      })
-      // we delete the temporary dialogue file
-      await deleteFile(dialogueSegmentFilePath)
-      // we overwrite the video segment
-      await deleteFile(videoSegmentFilePath)
-      videoSegmentFilePath = finalFilePathOfVideoWithSound
-    }
-    videoFilePaths.push(videoSegmentFilePath)
-  }
   console.log(`clapWithVideosToVideoFile: videoFilePaths: ${JSON.stringify(videoFilePaths, null, 2)}`)

 import { ClapProject, ClapSegment } from "@aitube/clap"
 import { getRandomDirectory } from "../files/getRandomDirectory.mts"
+import { videoSegmentToVideoFile } from "./videoSegmentToVideoFile.mts"
 export async function clapWithVideosToVideoFile({
   outputDir = outputDir || (await getRandomDirectory())
+  const videoFilePaths: string[] = await Promise.all(videoSegments.map(segment =>
+    videoSegmentToVideoFile({
+      clap,
+      segment,
+      outputDir,
+    })
+  ))
   console.log(`clapWithVideosToVideoFile: videoFilePaths: ${JSON.stringify(videoFilePaths, null, 2)}`)

src/core/exporters/storyboardSegmentToVideoFile.mts ADDED Viewed

	@@ -0,0 +1,103 @@

+import { join } from "node:path"
+import { ClapProject, ClapSegment } from "@aitube/clap"
+import { concatenateVideosWithAudio } from "../ffmpeg/concatenateVideosWithAudio.mts"
+import { writeBase64ToFile } from "../files/writeBase64ToFile.mts"
+import { addTextToVideo } from "../ffmpeg/addTextToVideo.mts"
+import { startOfSegment1IsWithinSegment2 } from "../utils/startOfSegment1IsWithinSegment2.mts"
+import { deleteFile } from "../files/deleteFile.mts"
+import { extractBase64 } from "../base64/extractBase64.mts"
+import { imageToVideoBase64 } from "../ffmpeg/imageToVideoBase64.mts"
+export async function storyboardSegmentToVideoFile({
+  clap,
+  segment,
+  outputDir,
+}: {
+  clap: ClapProject
+  segment: ClapSegment
+  outputDir: string
+}): Promise<string> {
+  let storyboardSegmentVideoFilePath = join(outputDir, `tmp_asset_${segment.id}_as_video.mp4`)
+  await imageToVideoBase64({
+    inputImageInBase64: segment.assetUrl,
+    outputFilePath: storyboardSegmentVideoFilePath,
+    width: clap.meta.width,
+    height: clap.meta.height,
+    outputVideoDurationInMs: 5000, // TODO this should be computed from the voice? or we can resize videos, toos
+    outputDir,
+    clearOutputDirAtTheEnd: false, // <- must stay false or else we lose everything!
+    outputVideoFormat: "mp4",
+  })
+  const interfaceSegments = clap.segments.filter(s =>
+    // nope, not all interfaces asset have the assetUrl
+    // although in the future.. we might want to
+    // s.assetUrl.startsWith("data:text/") &&
+    s.category === "interface" &&
+    startOfSegment1IsWithinSegment2(s, segment)
+  )
+  console.log(`clapWithStoryboardsToVideoFile: got ${interfaceSegments.length} interface segments for shot ${segment.id} [${segment.startTimeInMs}:${segment.endTimeInMs}]`)
+  const interfaceSegment = interfaceSegments.at(0)
+  if (interfaceSegment) {
+    // here we are free to use mp4, since this is an internal intermediary format
+    const videoSegmentWithOverlayFilePath = join(outputDir, `tmp_asset_${segment.id}_with_interface.mp4`)
+    await addTextToVideo({
+      inputVideoPath: storyboardSegmentVideoFilePath,
+      outputVideoPath: videoSegmentWithOverlayFilePath,
+      text: interfaceSegment.assetUrl.startsWith("data:text/")
+        ? atob(extractBase64(interfaceSegment.assetUrl).data)
+        : interfaceSegment.assetUrl,
+      width: clap.meta.width,
+      height: clap.meta.height,
+    })
+    // we overwrite
+    await deleteFile(storyboardSegmentVideoFilePath)
+    storyboardSegmentVideoFilePath = videoSegmentWithOverlayFilePath
+  }
+  const dialogueSegments = clap.segments.filter(s =>
+    s.assetUrl.startsWith("data:audio/") &&
+    s.category === "dialogue" &&
+    startOfSegment1IsWithinSegment2(s, segment)
+  )
+  console.log(`clapWithStoryboardsToVideoFile: got ${dialogueSegments.length} dialogue segments for shot ${segment.id} [${segment.startTimeInMs}:${segment.endTimeInMs}]`)
+  const dialogueSegment = dialogueSegments.at(0)
+  if (dialogueSegment) {
+    extractBase64(dialogueSegment.assetUrl)
+    const base64Info = extractBase64(dialogueSegment.assetUrl)
+    const dialogueSegmentFilePath = await writeBase64ToFile(
+      dialogueSegment.assetUrl,
+      join(outputDir, `tmp_asset_${segment.id}_dialogue.${base64Info.extension}`)
+    )
+    const finalFilePathOfVideoWithSound = await concatenateVideosWithAudio({
+      output: join(outputDir, `${segment.id}_video_with_audio.mp4`),
+      audioFilePath: dialogueSegmentFilePath,
+      videoFilePaths: [storyboardSegmentVideoFilePath],
+      // videos are silent, so they can stay at 0
+      videoTracksVolume: 0.0,
+      audioTrackVolume: 1.0,
+    })
+    // we delete the temporary dialogue file
+    await deleteFile(dialogueSegmentFilePath)
+    // we overwrite the video segment
+    await deleteFile(storyboardSegmentVideoFilePath)
+    storyboardSegmentVideoFilePath = finalFilePathOfVideoWithSound
+  }
+  return storyboardSegmentVideoFilePath
+}

src/core/exporters/videoSegmentToVideoFile.mts ADDED Viewed

	@@ -0,0 +1,84 @@

+import { join } from "node:path"
+import { ClapProject, ClapSegment } from "@aitube/clap"
+import { concatenateVideosWithAudio } from "../ffmpeg/concatenateVideosWithAudio.mts"
+import { writeBase64ToFile } from "../files/writeBase64ToFile.mts"
+import { addTextToVideo } from "../ffmpeg/addTextToVideo.mts"
+import { startOfSegment1IsWithinSegment2 } from "../utils/startOfSegment1IsWithinSegment2.mts"
+import { deleteFile } from "../files/deleteFile.mts"
+import { extractBase64 } from "../base64/extractBase64.mts"
+export async function videoSegmentToVideoFile({
+  clap,
+  segment,
+  outputDir,
+}: {
+  clap: ClapProject
+  segment: ClapSegment
+  outputDir: string
+}): Promise<string> {
+  const base64Info = extractBase64(segment.assetUrl)
+  // we write it to the disk *unconverted* (it might be a mp4, a webm or something else)
+  let videoSegmentFilePath = await writeBase64ToFile(
+    segment.assetUrl,
+    join(outputDir, `tmp_asset_${segment.id}.${base64Info.extension}`)
+  )
+  const interfaceSegments = clap.segments.filter(s =>
+    // nope, not all interfaces asset have the assetUrl
+    // although in the future.. we might want to
+    // s.assetUrl.startsWith("data:text/") &&
+    s.category === "interface" &&
+    startOfSegment1IsWithinSegment2(s, segment)
+  )
+  const interfaceSegment = interfaceSegments.at(0)
+  if (interfaceSegment) {
+    // here we are free to use mp4, since this is an internal intermediary format
+    const videoSegmentWithOverlayFilePath = join(outputDir, `tmp_asset_${segment.id}_with_interface.mp4`)
+    await addTextToVideo({
+      inputVideoPath: videoSegmentFilePath,
+      outputVideoPath: videoSegmentWithOverlayFilePath,
+      text: interfaceSegment.assetUrl.startsWith("data:text/")
+        ? atob(extractBase64(interfaceSegment.assetUrl).data)
+        : interfaceSegment.assetUrl,
+      width: clap.meta.width,
+      height: clap.meta.height,
+    })
+    // we overwrite
+    await deleteFile(videoSegmentFilePath)
+    videoSegmentFilePath = videoSegmentWithOverlayFilePath
+  }
+  const dialogueSegments = clap.segments.filter(s =>
+    s.assetUrl.startsWith("data:audio/") &&
+    s.category === "dialogue" &&
+    startOfSegment1IsWithinSegment2(s, segment)
+  )
+  const dialogueSegment = dialogueSegments.at(0)
+  if (dialogueSegment) {
+    extractBase64(dialogueSegment.assetUrl)
+    const base64Info = extractBase64(dialogueSegment.assetUrl)
+    const dialogueSegmentFilePath = await writeBase64ToFile(
+      dialogueSegment.assetUrl,
+      join(outputDir, `tmp_asset_${segment.id}_dialogue.${base64Info.extension}`)
+    )
+    const finalFilePathOfVideoWithSound = await concatenateVideosWithAudio({
+      output: join(outputDir, `${segment.id}_video_with_audio.mp4`),
+      audioFilePath: dialogueSegmentFilePath,
+      videoFilePaths: [videoSegmentFilePath],
+      // videos are silent, so they can stay at 0
+      videoTracksVolume: 0.0,
+      audioTrackVolume: 1.0,
+    })
+    // we delete the temporary dialogue file
+    await deleteFile(dialogueSegmentFilePath)
+    // we overwrite the video segment
+    await deleteFile(videoSegmentFilePath)
+    videoSegmentFilePath = finalFilePathOfVideoWithSound
+  }
+  return videoSegmentFilePath
+}