Automatic Speech Recognition
Transformers
Safetensors
GGUF
Korean
English
whisper
whisper-turbo
korean
speech-recognition
audio
asr
batiai
batisay
whisper.cpp
realtime
telephone
Instructions to use batiai/batisay-ko-turbo with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use batiai/batisay-ko-turbo with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("automatic-speech-recognition", model="batiai/batisay-ko-turbo")# Load model directly from transformers import AutoProcessor, AutoModelForMultimodalLM processor = AutoProcessor.from_pretrained("batiai/batisay-ko-turbo") model = AutoModelForMultimodalLM.from_pretrained("batiai/batisay-ko-turbo") - Notebooks
- Google Colab
- Kaggle
You need to agree to share your contact information to access this model
This repository is publicly accessible, but you have to accept the conditions to access its files and content.
BatiAI Community License v2.0 동의
본 모델 (batisay-ko-turbo) 은 통화/회의 강화 한국어 STT 모델입니다.
무료 모델 batisay-ko-base (Apache 2.0) 의 상위 버전 — 통화·회의·대화 멀티도메인 강화.
간단 요약 (외부 판매 X, 매출 10억 미만 → 자유):
| 누가 | 외부 판매? | 매출 10억+? | 결과 |
|---|---|---|---|
| 개인 / 학술 / 비영리 | - | - | ✅ 무료 |
| 회사 (사내 도구) | ❌ | ❌ | ✅ 무료 |
| 회사 (사내 도구) | ❌ | ✅ | ❌ 협의 |
| 외부 SaaS / 앱 임베드 | ✅ | - | ❌ 협의 |
자유 사용 (form 작성 후 즉시 download):
- 개인 / 학생 / 연구자 / 비영리
- 회사 사내 도구 (외부 판매 X) — 매출 10억 미만
- 정부 / 공공 기관 / 교육 기관
- PoC / 평가 (최초 6개월 무관)
사전 협의 필요 (→ support@bati.ai):
- 외부 SaaS / API 서비스 호스팅
- 제품 임베드 양산 (콜센터 단말, 회의 디바이스)
- 화이트 라벨 / 재판매
- 연매출 10억원 이상 회사의 상업 사용
Fair Source Sunset: 출시일로부터 4년 후 자동 Apache 2.0 전환.
본 form 제출 = License 동의로 간주.
💡 무료 옵션: batiai/batisay-ko-base (Apache 2.0)
Log in or Sign Up to review the conditions and access this model content.
batisay-ko-turbo — 한국어 음성 인식 (Whisper Turbo fine-tune)
통화 + 회의 + 대화 멀티도메인 한국어 STT (Whisper Large v3 Turbo fine-tune) transformers safetensors. GGUF(whisper.cpp/Mac)는 batisay-ko-turbo-GGUF.
CER Benchmark (RTZR-match strict, N=500/domain)
| 도메인 | CER | 참고 |
|---|---|---|
| 일반 음성 (깨끗) | 6.91% | KsponSpeech eval_clean |
| 일반 음성 (소음) | 7.87% | KsponSpeech eval_other |
| 회의 (다화자, 16kHz) | 7.73% | |
| 일상 대화 | 1.95% | |
| 통화 (콜센터, 8kHz) | 5.07% ⭐ | |
| 5도메인 평균 | 5.91% | RTZR API 평균 6.18% 추월 |
사용 방법
from transformers import pipeline
pipe = pipeline("automatic-speech-recognition", model="batiai/batisay-ko-turbo")
print(pipe("audio.wav", generate_kwargs={"language": "korean"})["text"])
모델 정보
- 베이스: OpenAI Whisper Large v3 Turbo (809M, 4-decoder)
- 학습: 3-Cycle 점진 학습 (일반 + 회의 + 강의 + 대화 + 통화, replay buffer 로 forgetting 방지)
- 라이센스: BatiAI Community v2 (gated) — 무료 옵션은 batisay-ko-base (Apache 2.0)
라이센스 — BatiAI Community v2
- ✅ 개인 / 연구 / 비영리 / 사내 도구(매출 10억 미만) = 자유 (form 동의 후)
- ⚠️ 외부 SaaS / 매출 10억+ 상업 = support@bati.ai 협의
- 🎁 출시 4년 후 자동 Apache 2.0 전환
문의: support@bati.ai · BatiAI: https://bati.ai
- Downloads last month
- 70
Model tree for batiai/batisay-ko-turbo
Base model
openai/whisper-large-v3 Finetuned
openai/whisper-large-v3-turbo