F5-TTS-THAI

โมเดลหลัก : SWivid/F5-TTS

Githup : https://github.com/SWivid/F5-TTS

ชุดข้อมูลที่นำไปเทรน

  • Porameht/processed-voice-th-169k
  • จำนวน
    • 150,000 เสียง
    • ประมาณ 165 ชั่วโมง
  • ขนาดโมเดลล่าสุด
    • 500,000 Steps
  • การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง

การใช้งาน

Github : https://github.com/VYNCX/F5-TTS-THAI

git clone https://github.com/VYNCX/F5-TTS-THAI.git
cd F5-TTS-THAI
python -m venv venv
call venv/scripts/activate
pip install git+https://github.com/VYNCX/F5-TTS-THAI.git

#จำเป็นต้องติดตั้งเพื่อใช้งานได้มีประสิทธิภาพกับ GPU
pip install torch==2.3.0+cu118 torchaudio==2.3.0+cu118 --extra-index-url https://download.pytorch.org/whl/cu118

สามารถรันไฟล์ app-webui.bat เพื่อใช้งานได้ หรือ

  python src/f5_tts/f5_tts_webui.py

ฝึกอบรม และ Finetune

ใช้งานบน Google Colab Finetune หรือ

  • ติดตั้ง
  cd F5-TTS-THAI
  pip install -e .
  • เปิด Gradio
  f5-tts_finetune-gradio

ตัวอย่างเสียง

  • เสียงต้นแบบ
    • ข้อความคำพูด : ฉันเดินทางไปเที่ยวที่จังหวัดเชียงใหม่ในช่วงฤดูหนาวเพื่อสัมผัสอากาศเย็นสบาย
  • เสียงที่สร้างขึ้น
    • Seed : 4213936761049775187
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for VIZINTZOR/F5-TTS-THAI

Base model

SWivid/F5-TTS
Finetuned
(38)
this model

Dataset used to train VIZINTZOR/F5-TTS-THAI

Collection including VIZINTZOR/F5-TTS-THAI