miosipof
/

speecht5_tts_dysarthria_v1

TensorBoard

Safetensors

speecht5

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

miosipof commited on Oct 26, 2024

Commit

a1f9bed

verified ·

1 Parent(s): 0ebee53

End of training

Browse files

Files changed (2) hide show

README.md +15 -29
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -1,6 +1,4 @@
 ---
-license: mit
-base_model: miosipof/speecht5_tts_voxpopuli_it_v2
 tags:
 - generated_from_trainer
 datasets:
@@ -15,9 +13,9 @@ should probably proofread and complete it, then remove this comment. -->
 # speecht5_tts_dysarthria_v1
-This model is a fine-tuned version of [miosipof/speecht5_tts_voxpopuli_it_v2](https://huggingface.co/miosipof/speecht5_tts_voxpopuli_it_v2) on the audiofolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5234
 ## Model description
@@ -36,7 +34,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-06
 - train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
@@ -44,34 +42,22 @@ The following hyperparameters were used during training:
 - total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 100
-- training_steps: 500
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch   | Step | Validation Loss |
-|:-------------:|:-------:|:----:|:---------------:|
-| 1.0113        | 0.7042  | 25   | 0.8442          |
-| 0.8           | 1.4085  | 50   | 0.7084          |
-| 0.7291        | 2.1127  | 75   | 0.6323          |
-| 0.6698        | 2.8169  | 100  | 0.5875          |
-| 0.6339        | 3.5211  | 125  | 0.5633          |
-| 0.5747        | 4.2254  | 150  | 0.5552          |
-| 0.5837        | 4.9296  | 175  | 0.5436          |
-| 0.5882        | 5.6338  | 200  | 0.5417          |
-| 0.5692        | 6.3380  | 225  | 0.5363          |
-| 0.5577        | 7.0423  | 250  | 0.5340          |
-| 0.5411        | 7.7465  | 275  | 0.5323          |
-| 0.5551        | 8.4507  | 300  | 0.5301          |
-| 0.5671        | 9.1549  | 325  | 0.5292          |
-| 0.5313        | 9.8592  | 350  | 0.5254          |
-| 0.5546        | 10.5634 | 375  | 0.5246          |
-| 0.5283        | 11.2676 | 400  | 0.5231          |
-| 0.5484        | 11.9718 | 425  | 0.5222          |
-| 0.5251        | 12.6761 | 450  | 0.5222          |
-| 0.5443        | 13.3803 | 475  | 0.5223          |
-| 0.5357        | 14.0845 | 500  | 0.5234          |
 ### Framework versions

 ---
 tags:
 - generated_from_trainer
 datasets:
 # speecht5_tts_dysarthria_v1
+This model was trained from scratch on the audiofolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5207
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 1e-06
 - train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 50
+- training_steps: 200
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss |
+|:-------------:|:------:|:----:|:---------------:|
+| 0.5385        | 0.7042 | 25   | 0.5221          |
+| 0.5296        | 1.4085 | 50   | 0.5202          |
+| 0.5471        | 2.1127 | 75   | 0.5208          |
+| 0.5408        | 2.8169 | 100  | 0.5204          |
+| 0.5497        | 3.5211 | 125  | 0.5198          |
+| 0.5193        | 4.2254 | 150  | 0.5219          |
+| 0.5317        | 4.9296 | 175  | 0.5184          |
+| 0.5409        | 5.6338 | 200  | 0.5207          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fda068df3a6d81d09f4da0214cbeaeb09027dcac4ed6d2ab5d4f4a8f9bb4b801
 size 577789320

 version https://git-lfs.github.com/spec/v1
+oid sha256:563e3be2ee1334de6f2dc0daf8bc7f4c474bf6c5f456023168d618b23adb72aa
 size 577789320