Whisper large v2 ap3 - Nuwan 4000

This model is a fine-tuned version of openai/whisper-large-v2 on the None dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 1e-06
train_batch_size: 16
eval_batch_size: 16
seed: 42
optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: constant_with_warmup
training_steps: 2000
mixed_precision_training: Native AMP

Training Loss	Epoch	Step	Validation Loss	Wer Ortho	Wer
0.6232	0.2368	400	0.6759	40.8009	39.6457
0.5312	0.4737	800	0.6170	38.6556	37.7024
0.5302	0.7105	1200	0.5849	35.3744	34.4701
0.4828	0.9473	1600	0.5638	32.1974	31.4177
0.4344	1.1841	2000	0.5519	29.7334	29.0117

Safetensors

Model size

2B params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

(282)

this model