File size: 684 Bytes
3107242
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
from src.scraping.youtube_transcript import fetch_youtube_transcripts
from src.youtube_embd.preprocess import run_preprocessing
from src.youtube_embd.embed import run_embedding
from src.youtube_embd.index import run_indexing
from src.configs.config import MAX_VIDEOS


if __name__ == "__main__":
    print("\n-> Lancement de l'extraction des transcriptions YouTube...")
    fetch_youtube_transcripts(max_videos=MAX_VIDEOS)

    print("\n-> Prétraitement des sous-titres...")
    run_preprocessing()

    print("\n-> Génération des embeddings...")
    run_embedding()

    print("\n-> Indexation FAISS...")
    run_indexing()

    print("\n-> Tous les traitements sont terminés.")