mvp1024
/

asr

Model card Files Files and versions Community

maolin.liu commited on Nov 26, 2024

Commit

1e44fe0

1 Parent(s): 59ef18e

[feature]First commit.

Browse files

Files changed (2) hide show

requirements.txt +3 -0
server.py +92 -0

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+faster-whisper==1.1.0
+fastapi==0.115.5
+uvicorn==0.32.1

server.py ADDED Viewed

	@@ -0,0 +1,92 @@

+import os
+import typing
+from contextlib import asynccontextmanager
+import uvicorn
+from fastapi import FastAPI, Request, UploadFile, File
+from fastapi.middleware.cors import CORSMiddleware
+from fastapi.middleware.gzip import GZipMiddleware
+from faster_whisper import WhisperModel
+from pydantic import BaseModel, Field, FilePath
+@asynccontextmanager
+async def register_init(app: FastAPI):
+    """
+    启动初始化
+    :return:
+    """
+    yield
+def register_middleware(app: FastAPI):
+    # Gzip: Always at the top
+    app.add_middleware(GZipMiddleware)
+    # CORS: Always at the end
+    app.add_middleware(
+        CORSMiddleware,
+        allow_origins=['*'],
+        allow_credentials=True,
+        allow_methods=['*'],
+        allow_headers=['*'],
+    )
+def create_app():
+    app = FastAPI(
+        lifespan=register_init
+    )
+    register_middleware(app)
+    return app
+app = create_app()
+model_size = os.environ.get('WHISPER-MODEL-SIZE', 'large-v3')
+# Run on GPU with FP16
+whisper_model: typing.Optional[WhisperModel] = WhisperModel(model_size, device='cuda', compute_type='float16')
+class TranscribeRequestParams(BaseModel):
+    uuid: str = Field(title='Request Unique Id.')
+    audio_file: FilePath = Field()
+    language: typing.Literal['en', 'zh',]
+@app.post('/transcribe')
+def transcribe_api(
+        request: Request,
+        obj: TranscribeRequestParams
+):
+    transcribed_text = whisper_model.transcribe(obj.audio_file, language=obj.language)
+    return {
+        "if_success": True,
+        'uuid': obj.uuid,
+        'transcribed_text': transcribed_text
+    }
+@app.post('/transcribe-file')
+def transcribe_file_api(
+        request: Request,
+        uuid: str,
+        audio_file: typing.Annotated[UploadFile, File()],
+        language: typing.Literal['en', 'zh']
+):
+    transcribed_text = whisper_model.transcribe(audio_file.file, language=language)
+    return {
+        "if_success": True,
+        'uuid': uuid,
+        'transcribed_text': transcribed_text
+    }
+if __name__ == '__main__':
+    uvicorn.run(
+        app,
+        host=os.environ.get('HOST', '0.0.0.0'),
+        port=int(os.environ.get('PORT', 8080))
+    )