NHLOCAL commited on
Commit
fe146d2
·
1 Parent(s): 8c1b5b4

Delete ROADMAP.md

Browse files
Files changed (1) hide show
  1. ROADMAP.md +0 -68
ROADMAP.md DELETED
@@ -1,68 +0,0 @@
1
-
2
- ## **מפת דרכים מעודכנת - פרויקט תמלול שיעורי תורה**
3
-
4
- ### **משימות שהושלמו (Completed Tasks)**
5
-
6
- * **[x]‏ פונקציונליות ליבה: תמיכה בקבצי וידאו**
7
- * **תיאור:** נוספה תמיכה בהעלאת קבצי וידאו. המערכת מחלצת את ערוץ האודיו מהקובץ ושולחת אותו לתמלול.
8
- * **[x]‏ פורמטי פלט: פלט כטקסט רציף (`.txt`)**
9
- * **תיאור:** נוסף כפתור להורדת התמלול כקובץ טקסט ללא תזמונים, בנוסף לקובץ הכתוביות (`.srt`).
10
- * **[x]‏ פורמטי פלט: פורמט "טקסט ערוך"**
11
- * **תיאור:** פותח פורמט פלט חדש לעריכת תמלול כטקסט רציף, עם הטמעת תזמונים בתחילת כל פסקה לסנכרון ועריכה נוחה.
12
- * **[x]‏ UI/UX: חסימת העלאה כפולה**
13
- * **תיאור:** נחסמה האפשרות להעלות קובץ חדש בזמן שתהליך תמלול פעיל, למניעת שגיאות.
14
- * **[x]‏ שיפורים בעורך הכתוביות (Editor)**
15
- * **תיאור:** שודרג ממשק החיפוש וההחלפה, תוקנה לוגיקת ביטול/שחזור (Undo/Redo), ונוספה תמיכה בפורמט "טקסט ערוך".
16
-
17
- ---
18
-
19
- ### **משימות לטיפול מיידי (Next Up / High Priority)**
20
-
21
- * **[ ]‏ Bug Fix: השמטת סוף הקובץ בתמלול**
22
- * **תיאור:** באג קריטי שדווח על ידי מספר משתמשים. החלק האחרון של קובץ האודיו (מספר דקות בסוף) אינו מתומלל או מתומלל באופן חלקי מאוד. נראה שהבעיה היא בעיבוד ה-chunk האחרון.
23
- * **פעולות נדרשות:** לבצע Debug לתהליך פיצול הקבצים, לוודא שהחלק האחרון נוצר בגודל תקין ונשלח ל-API, ולבדוק את תהליך איחוד התוצאות.
24
- * **[ ]‏ Error Handling: טיפול מתקדם בשגיאות API ושיפור משוב למשתמש**
25
- * **תיאור:** משתמשים נתקלים בשגיאות API גנריות ולא ברורות. יש לשפר את הטיפול בהן ולהציג הודעות משמעותיות.
26
- * **פעולות נדרשות:**
27
- 1. ללכוד שגיאות ספציפיות: `resource_exhausted` (עומס על שרתי גוגל), `failed to fetch` (בעיית רשת/סינון), `the JSON object must be str... not NoneType` (תשובה ריקה/שגויה מה-API).
28
- 2. להציג הודעות שגיאה מותאמות למשתמש (למשל: "השרתים עמוסים, נסה שוב בעוד מספר דקות", "בעיית תקשורת, בדוק את חיבור האינטרנט או השבת חוסמי פרסומות").
29
- 3. להוסיף בדיקת תקינות (Validation) לתשובת ה-JSON מה-API לפני ניסיון לעבד אותה.
30
- * **[ ]‏ Bug Fix: טעינת "טקסט ערוך" בעורך הכתוביות נכשלת**
31
- * **תיאור:** משתמש דיווח על שגיאה בעת ניסיון לטעון קובץ בפורמט "טקסט ערוך" החדש אל תוך עורך הכתוביות.
32
- * **פעולות נדרשות:** לבדוק את לוגיקת ה-Parsing של הפורמט החדש בעורך הכתוביות ולוודא תאימות מלאה.
33
-
34
- ---
35
-
36
- ### **משימות מתוכננות (Planned / Backlog)**
37
-
38
- * **[ ]‏ Feature: תמיכה בקישורי YouTube**
39
- * **תיאור:** הוספת שדה להדבקת קישור יוטיוב, וחילוץ אוטומטי של האודיו לתמלול.
40
- * **פעולות נדרשות:** שילוב ספרייה בצד השרת (כגון `yt-dlp`) לטיפול בקישורים.
41
- * **[ ]‏ Model/Prompt Tuning: תמיכה בשפות והגיות נוספות**
42
- * **תיאור:** הוספת אפשרות בחירת שפה/הגייה לפני התמלול כדי להשתמש בפרומפט מותאם ולהגביר דיוק.
43
- * **משימות משנה:**
44
- * **[ ]‏ תמיכה באנגלית:** יצירת פרומפט ייעודי לתמלול שיעורים/הרצאות באנגלית.
45
- * **[ ]‏ תמיכה ביידיש/הגייה חסידית:** התאמת הפרומפט הקיים או יצירת חדש שיזהה ויפרש נכון מילים בהגייה חסידית (למשל, "חימיש" -> חומש).
46
- * **[ ]‏ Feature: זיהוי והפרדת דוברים (Speaker Diarization)**
47
- * **תיאור:** יכולת לזהות דוברים שונים ולסמן את התמלול בהתאם (למשל, "דובר א:", "דובר ב:").
48
- * **פעולות נדרשות:** מחקר ובחינת יכולות מובנות ב-API של Gemini או שילוב כלי חיצוני לניתוח מקדים של האודיו.
49
- * **[ ]‏ Refinement: שיפור פיצול שורות בכתוביות (Subtitle Line Breaking)**
50
- * **תיאור:** משתמשים ציינו שכתוביות SRT נוטות להיות ארוכות מדי (לפעמים 3 שורות), מה שמקשה על קריאה.
51
- * **פעולות נדרשות:** לשפר את הפרומפט עבור יצירת כתוביות כך שיכלול הנחיות ברורות לפיצול למקטעים קצרים יותר (למשל, עד 2 שורות לכתובית, עד X תווים לשורה).
52
-
53
- ---
54
-
55
- ### **רעיונות לעתיד ושיפורים אסטרטגיים (Future / Vision)**
56
-
57
- * **[ ]‏ Platform: יצירת "ארגז כלים" מאוחד**
58
- * **תיאור:** איחוד כלי התמלול, עורך הכתוביות וכלים עתידיים לפלטפורמה אחת עם ניהול API מרכזי, המאפשרת העברת פלט בין הכלים בצורה חלקה (לדוגמה, תמלול -> הגהה -> עריכה).
59
- * **[ ]‏ Feature: תמיכה בקישורי Google Drive**
60
- * **תיאור:** מתן אפשרות להדביק קישור שיתוף לקובץ אודיו/וידאו מגוגל דרייב.
61
- * **[ ]‏ Advanced Feature: שלב הגהה אוטומטי (Post-processing AI pass)**
62
- * **תיאור:** הוספת אופציה לשלוח את התמלול הגולמי לסבב נוסף ב-API עם פרומפט ייעודי להגהה, תיקון שגיאות נפוצות, ושיפור ניסוח.
63
- * **[ ]‏ Advanced Feature: תהליך עבודה לתרגום כתוביות**
64
- * **תיאור:** הוספת יכולת לתמלל סרט באנגלית, ולאחר מכן לשלוח את קובץ ה-SRT לתרגום לעברית תוך שמירה על התזמונים.
65
- * **[ ]‏ Quality of Life: אפשרויות עיצוב לפלט טקסט**
66
- * **תיאור:** מתן אפשרות למשתמש לבחור את מבנה פלט הטקסט, כגון שימוש ברווח שורה יחיד או כפול בין פסקאות.
67
- * **[ ]‏ UI/UX: פתרון בעיית התצוגה ב"נטפרי"**
68
- * **תיאור:** חקירה מעמיקה של הסיבה שרכיבים דינמיים (כמו סרגל התקדמות) לא עובדים בנטפרי, ויישום פתרון חלופי (Fallback) כמו `polling` להצגת התקדמות.