Kamtera
/

persian-tts-multispeaker-vits

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Kamtera commited on Mar 10, 2023

Commit

d2ed842

•

1 Parent(s): 34e7c0c

Update train_vits-0.py

Files changed (1) hide show

train_vits-0.py +7 -5

train_vits-0.py CHANGED Viewed

@@ -36,15 +36,15 @@ def mozilla_with_speaker(root_path, meta_file, **kwargs):  # pylint: disable=unu
 dataset_config1 = BaseDatasetConfig(
-    meta_file_train="metadata.csv", path="/kaggle/input/persian-tts-dataset-famale"
 )
 dataset_config2 = BaseDatasetConfig(
-    meta_file_train="metadata.csv", path="/kaggle/input/persian-tts-dataset"
 )
 dataset_config3 = BaseDatasetConfig(
-    meta_file_train="metadata.csv", path="/kaggle/input/persian-tts-dataset-male"
 )
@@ -126,8 +126,10 @@ train_samples, eval_samples = load_tts_samples(
 speaker_manager = SpeakerManager()
 speaker_manager.set_ids_from_data(train_samples + eval_samples, parse_key="speaker_name")
 config.num_speakers = speaker_manager.num_speakers
 # init model
 model = Vits(config, ap, tokenizer, speaker_manager=speaker_manager)

 dataset_config1 = BaseDatasetConfig(
+    formatter="mozilla" ,meta_file_train="metadata.csv", path="/kaggle/input/persian-tts-dataset-famale"
 )
 dataset_config2 = BaseDatasetConfig(
+    formatter="mozilla" ,meta_file_train="metadata.csv", path="/kaggle/input/persian-tts-dataset"
 )
 dataset_config3 = BaseDatasetConfig(
+    formatter="mozilla" ,meta_file_train="metadata.csv", path="/kaggle/input/persian-tts-dataset-male"
 )
 speaker_manager = SpeakerManager()
 speaker_manager.set_ids_from_data(train_samples + eval_samples, parse_key="speaker_name")
 config.num_speakers = speaker_manager.num_speakers
+print("\n"*10)
+print("#>"*10)
+print(speaker_manager.speaker_names)
+print("\n"*10)
 # init model
 model = Vits(config, ap, tokenizer, speaker_manager=speaker_manager)