Spaces:

Uhhy
/

transcription-service

Build error

Uhhy commited on Aug 31, 2024

Commit

a003783

•

1 Parent(s): a524c1d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,22 +1,30 @@
 from fastapi import FastAPI, HTTPException, UploadFile, File
 from pydantic import BaseModel
 from multiprocessing import Process, Queue
-import whisper
 import io
 import uvicorn
 app = FastAPI()
-model = whisper.load_model("large")
 class TranscriptionRequest(BaseModel):
     file: UploadFile
 def transcribe_audio(file, queue):
     try:
-        audio = io.BytesIO(file.file.read())
-        result = model.transcribe(audio)
-        queue.put(result["text"])
     except Exception as e:
         queue.put(f"Error: {str(e)}")

 from fastapi import FastAPI, HTTPException, UploadFile, File
 from pydantic import BaseModel
 from multiprocessing import Process, Queue
+from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
+import torch
 import io
 import uvicorn
+import soundfile as sf
 app = FastAPI()
+# Cargar el modelo y el procesador
+model_name = "facebook/wav2vec2-large-960h-lv60"
+processor = Wav2Vec2Processor.from_pretrained(model_name)
+model = Wav2Vec2ForCTC.from_pretrained(model_name)
 class TranscriptionRequest(BaseModel):
     file: UploadFile
 def transcribe_audio(file, queue):
     try:
+        audio, _ = sf.read(io.BytesIO(file.file.read()))
+        input_values = processor(audio, return_tensors="pt", padding="longest").input_values
+        logits = model(input_values).logits
+        predicted_ids = torch.argmax(logits, dim=-1)
+        transcription = processor.batch_decode(predicted_ids)[0]
+        queue.put(transcription)
     except Exception as e:
         queue.put(f"Error: {str(e)}")