AkitoP's picture
Update README.md
9a183ca verified
metadata
license: apache-2.0

GPT-SoVITS-JP-ProsodyControl

简介

GPT-SoVITS-JP-ProsodyControl是一个基于GPT-SoVITS预训练模型的扩展,专门为实现更精细的日语音高控制而设计。通过在预训练模型中引入两个新的符号[],在200小时的日语数据上进一步微调了8个epoch,使其能够在一定程度上通过调整[]符号来修正音高。

注意事项

由于模型主要针对日语数据进行微调,其对英语和中文的处理能力相对较弱。

使用示例

以下是一个音高修复的示例:

  • 原始文本: サトノダイヤモンド
  • 原始发音(无音高标注模型): s a t o n o d a i y a m o N d o
  • OpenJTalk默认标注: s a ] t o UNK n o UNK d a [ i y a m o ] N d o
  • 手动调整后的发音: s a [ t o UNK n o UNK d a [ i y a m o ] N d o