請問繁中的語音模型可以怎樣微調?

#1
by doggy8088 - opened

我想請問繁中的語音模型可以怎樣微調?不知道是否可以提供一些參考資源,謝謝!

我目前是用自己寫的工具 wft 去微調,同時參考 HuggingFace 的文章

資料集是用 Common Voice 16.1 裡面的 zh-TW subset這個模型的訓練記錄在 LoRA 那邊,或許可供參考。

這個模型訓練租用的雲端 GPU 成本大概 3 USD(我在 RunPod 上面租 A40 跑了 7 小時)。

btw Common Voice zh-TW subset 裡 train+validation的錄音好像其實也不多,也許還不到 20 小時;我還在看有沒有其他公開的資料集能用。

謝謝你的回覆!😊

Sign up or log in to comment