AI

Runtime error

App Files Files Community

MatteoScript commited on Jun 16

Commit

e5494cb

verified ·

1 Parent(s): 16662d1

Update main.py

Browse files

Files changed (1) hide show

main.py +130 -5

main.py CHANGED Viewed

@@ -3,7 +3,7 @@ import time
 import random
 import asyncio
 import json
-from fastapi import FastAPI, HTTPException, Depends
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.security.api_key import APIKeyHeader
 from pydantic import BaseModel
@@ -12,7 +12,10 @@ from dotenv import load_dotenv
 from starlette.responses import StreamingResponse
 from openai import OpenAI
 from typing import List, Optional, Dict, Any
 import copy
 load_dotenv()
@@ -26,7 +29,17 @@ API_KEYS = [
     os.getenv("API_GEMINI_4"),
     os.getenv("API_GEMINI_5"),
 ]
 # Classi Pydantic di VALIDAZIONE Body
 class ChatCompletionRequest(BaseModel):
     model: str = "gemini-2.0-flash"
@@ -181,14 +194,14 @@ def call_api_sync(params: ChatCompletionRequest):
         if params.messages:
             params.messages = sanitize_messages(params.messages)
         params = convert_payload_for_gemini(params)
-        print('------------------------------------- INPUT --------------------------------')
         print(params)
         response_format = getattr(params, 'response_format', None)
         if response_format and getattr(response_format, 'type', None) == 'json_schema':
             response = client.beta.chat.completions.parse(**params.model_dump())
         else:
             response = client.chat.completions.create(**params.model_dump())
-        print('------------------------------------- OUTPUT -------------------------------')
         print(response)
         print("")
         return response
@@ -208,11 +221,21 @@ async def _resp_async_generator(params: ChatCompletionRequest):
         if params.messages:
             params.messages = sanitize_messages(params.messages)
         params = convert_payload_for_gemini(params)
         for chunk in response:
             chunk_data = chunk.to_dict() if hasattr(chunk, "to_dict") else chunk
             yield f"data: {json.dumps(chunk_data)}\n\n"
             await asyncio.sleep(0.01)
         yield "data: [DONE]\n\n"
     except Exception as e:
         if "429" in str(e):
             await asyncio.sleep(2)
@@ -222,6 +245,83 @@ async def _resp_async_generator(params: ChatCompletionRequest):
             error_data = {"error": str(e)}
             yield f"data: {json.dumps(error_data)}\n\n"
 # ---------------------------------- Metodi API ---------------------------------------
 @app.get("/")
 def read_general():
@@ -243,6 +343,31 @@ async def chat_completions(req: ChatCompletionRequest):
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
 if __name__ == "__main__":
     import uvicorn
-    uvicorn.run("main:app", host="0.0.0.0", port=8000, reload=True)

 import random
 import asyncio
 import json
+from fastapi import FastAPI, HTTPException, Depends, File, UploadFile, Form
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.security.api_key import APIKeyHeader
 from pydantic import BaseModel
 from starlette.responses import StreamingResponse
 from openai import OpenAI
 from typing import List, Optional, Dict, Any
+import io
 import copy
+from pathlib import Path
+from pydub import AudioSegment
 load_dotenv()
     os.getenv("API_GEMINI_4"),
     os.getenv("API_GEMINI_5"),
 ]
+GROQ_BASE_URL  = "https://api.groq.com/openai/v1"
+WHISPER_MODEL  = "whisper-large-v3-turbo"
+SEGMENT_MINUTES = 50
+GROQ_API_KEYS  = [
+    os.getenv("API_GROQ_1"),
+    #os.getenv("API_GROQ_2"),
+    #os.getenv("API_GROQ_3"),
+    #os.getenv("API_GROQ_4"),
+    #os.getenv("API_GROQ_5")
+]
 # Classi Pydantic di VALIDAZIONE Body
 class ChatCompletionRequest(BaseModel):
     model: str = "gemini-2.0-flash"
         if params.messages:
             params.messages = sanitize_messages(params.messages)
         params = convert_payload_for_gemini(params)
+        print('------------------------------------------------------- INPUT ---------------------------------------------------------------')
         print(params)
         response_format = getattr(params, 'response_format', None)
         if response_format and getattr(response_format, 'type', None) == 'json_schema':
             response = client.beta.chat.completions.parse(**params.model_dump())
         else:
             response = client.chat.completions.create(**params.model_dump())
+        print('------------------------------------------------------- OUTPUT ---------------------------------------------------------------')
         print(response)
         print("")
         return response
         if params.messages:
             params.messages = sanitize_messages(params.messages)
         params = convert_payload_for_gemini(params)
+        print('------------------------------------------------------- INPUT ---------------------------------------------------------------')
+        print(params.model_dump_json(indent=4))
+        final_response_content = ''
         for chunk in response:
             chunk_data = chunk.to_dict() if hasattr(chunk, "to_dict") else chunk
+            chunk_content = None
+            if chunk.choices and chunk.choices[0].delta:
+                chunk_content = chunk.choices[0].delta.content
+            if chunk_content:
+                final_response_content += chunk_content
             yield f"data: {json.dumps(chunk_data)}\n\n"
             await asyncio.sleep(0.01)
         yield "data: [DONE]\n\n"
+        print('------------------------------------------------------- OUTPUT ---------------------------------------------------------------')
+        print(final_response_content)
     except Exception as e:
         if "429" in str(e):
             await asyncio.sleep(2)
             error_data = {"error": str(e)}
             yield f"data: {json.dumps(error_data)}\n\n"
+def get_openai_client():
+    ''' Client OpenAI passando in modo RANDOM le Chiavi API. In questo modo posso aggirare i limiti "Quota Exceeded" '''
+    api_key = random.choice(API_KEYS)
+    return OpenAI(api_key=api_key, base_url=BASE_URL)
+# API Whisper Audio:
+FORMAT_ALIASES = {
+    "mpeg": "mp3",
+    "x-wav": "wav",
+    "vnd.wave": "wav",
+    "x-m4a": "m4a",
+    "x-aac": "aac",
+}
+def _detect_format(upload_file: UploadFile) -> str:
+    """Rileva il formato audio dal MIME-type o dall'estensione, con alias safe."""
+    if upload_file.content_type and upload_file.content_type.startswith("audio/"):
+        fmt = upload_file.content_type.split("/", 1)[1]
+    else:
+        fmt = Path(upload_file.filename).suffix.lstrip(".").lower()
+    return FORMAT_ALIASES.get(fmt, fmt)
+def _split_audio_to_mp3_chunks(audio_bytes: bytes, input_format: str, minutes: int):
+    """ Converte (se serve) e splitta. Lascia che ffmpeg auto-rilevi il formato passando format=None: è più sicuro e ignora alias sbagliati. """
+    try:
+        audio = AudioSegment.from_file(io.BytesIO(audio_bytes))
+    except Exception:
+        audio = AudioSegment.from_file(io.BytesIO(audio_bytes), format=input_format)
+    chunk_len_ms = minutes * 60 * 1000
+    for start_ms in range(0, len(audio), chunk_len_ms):
+        chunk = audio[start_ms : start_ms + chunk_len_ms]
+        buf = io.BytesIO()
+        chunk.export(buf, format="mp3")
+        yield buf.getvalue()
+def _transcribe_chunk(chunk_bytes: bytes,
+                      model: str,
+                      language: str,
+                      response_format: str = "json") -> str:
+    bio = io.BytesIO(chunk_bytes)
+    bio.name = "chunk.mp3"
+    resp = call_whisper_api(
+        bio,
+        model=model,
+        language=language,
+        response_format=response_format
+    )
+    if isinstance(resp, str):
+        return resp
+    if hasattr(resp, "text"):
+        return resp.text
+    return resp.get("text", "")
+def get_whisper_client():
+    api_key = random.choice(GROQ_API_KEYS)
+    return OpenAI(api_key=api_key, base_url=GROQ_BASE_URL)
+def call_whisper_api(audio_file: io.BytesIO,
+                     model: str = WHISPER_MODEL,
+                     language: str = "it",
+                     response_format: str = "json"):
+    try:
+        client = get_whisper_client()
+        return client.audio.transcriptions.create(
+            file=audio_file,
+            model=model,
+            language=language,
+            response_format=response_format
+        )
+    except Exception as e:
+        if "429" in str(e):
+            time.sleep(2)
+            return call_whisper_api(audio_file, model, language, response_format)
+        raise e
 # ---------------------------------- Metodi API ---------------------------------------
 @app.get("/")
 def read_general():
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
+@app.post("/v1/audio/transcriptions", dependencies=[Depends(verify_api_key)])
+async def audio_transcriptions_endpoint(
+    file: UploadFile = File(...),
+    model: str = Form(WHISPER_MODEL),
+    language: str = Form("it"),
+    response_format: str = Form("text"),
+    segment_minutes: int = Form(SEGMENT_MINUTES)):
+    try:
+        raw_bytes = await file.read()
+        input_fmt  = _detect_format(file) or "mp3"
+        chunks = list(_split_audio_to_mp3_chunks(raw_bytes, input_fmt, segment_minutes))
+        if not chunks:
+            raise ValueError("Audio vuoto o formato non riconosciuto")
+        transcripts = [_transcribe_chunk(c, model, language, response_format) for c in chunks]
+        final_text = "\n\n".join(transcripts)
+        return {
+            "model": model,
+            "language": language,
+            "segments": len(transcripts),
+            "segment_minutes": segment_minutes,
+            "text": final_text,
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
 if __name__ == "__main__":
     import uvicorn
+    uvicorn.run("main:app", host="0.0.0.0", port=8000, reload=True)