You need to agree to share your contact information to access this model

This repository is publicly accessible, but you have to accept the conditions to access its files and content.

BatiAI Community License v2.0 동의

본 모델 (batisay-ko-turbo) 은 통화/회의 강화 한국어 STT 모델입니다.
무료 모델 batisay-ko-base (Apache 2.0) 의 상위 버전 — 통화·회의·대화 멀티도메인 강화.

간단 요약 (외부 판매 X, 매출 10억 미만 → 자유):

누가 외부 판매? 매출 10억+? 결과
개인 / 학술 / 비영리 - - ✅ 무료
회사 (사내 도구) ✅ 무료
회사 (사내 도구) ❌ 협의
외부 SaaS / 앱 임베드 - ❌ 협의

자유 사용 (form 작성 후 즉시 download):

  • 개인 / 학생 / 연구자 / 비영리
  • 회사 사내 도구 (외부 판매 X) — 매출 10억 미만
  • 정부 / 공공 기관 / 교육 기관
  • PoC / 평가 (최초 6개월 무관)

사전 협의 필요 (→ support@bati.ai):

  • 외부 SaaS / API 서비스 호스팅
  • 제품 임베드 양산 (콜센터 단말, 회의 디바이스)
  • 화이트 라벨 / 재판매
  • 연매출 10억원 이상 회사의 상업 사용

Fair Source Sunset: 출시일로부터 4년 후 자동 Apache 2.0 전환.

본 form 제출 = License 동의로 간주.

💡 무료 옵션: batiai/batisay-ko-base (Apache 2.0)

Log in or Sign Up to review the conditions and access this model content.

batisay-ko-turbo — 한국어 음성 인식 (Whisper Turbo fine-tune)

통화 + 회의 + 대화 멀티도메인 한국어 STT (Whisper Large v3 Turbo fine-tune) transformers safetensors. GGUF(whisper.cpp/Mac)는 batisay-ko-turbo-GGUF.

CER Benchmark (RTZR-match strict, N=500/domain)

도메인 CER 참고
일반 음성 (깨끗) 6.91% KsponSpeech eval_clean
일반 음성 (소음) 7.87% KsponSpeech eval_other
회의 (다화자, 16kHz) 7.73%
일상 대화 1.95%
통화 (콜센터, 8kHz) 5.07%
5도메인 평균 5.91% RTZR API 평균 6.18% 추월

사용 방법

from transformers import pipeline
pipe = pipeline("automatic-speech-recognition", model="batiai/batisay-ko-turbo")
print(pipe("audio.wav", generate_kwargs={"language": "korean"})["text"])

모델 정보

  • 베이스: OpenAI Whisper Large v3 Turbo (809M, 4-decoder)
  • 학습: 3-Cycle 점진 학습 (일반 + 회의 + 강의 + 대화 + 통화, replay buffer 로 forgetting 방지)
  • 라이센스: BatiAI Community v2 (gated) — 무료 옵션은 batisay-ko-base (Apache 2.0)

라이센스 — BatiAI Community v2

  • ✅ 개인 / 연구 / 비영리 / 사내 도구(매출 10억 미만) = 자유 (form 동의 후)
  • ⚠️ 외부 SaaS / 매출 10억+ 상업 = support@bati.ai 협의
  • 🎁 출시 4년 후 자동 Apache 2.0 전환

문의: support@bati.ai · BatiAI: https://bati.ai

Downloads last month
70
Safetensors
Model size
0.8B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for batiai/batisay-ko-turbo

Finetuned
(542)
this model