rumeyskeskn
/

wav2vec2-large-xls-r-300m-tr-cv16.1

Automatic Speech Recognition

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

rumeyskeskn commited on Apr 3

Commit

6ffd2c3

•

1 Parent(s): b5d2137

Update README.md

Files changed (1) hide show

README.md +24 -0

README.md CHANGED Viewed

@@ -64,6 +64,30 @@ The following hyperparameters were used during training:
 - num_epochs: 2
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Wer    |

 - num_epochs: 2
 - mixed_precision_training: Native AMP
+## Model Inference
+```python
+from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
+model = Wav2Vec2ForCTC.from_pretrained("rumeyskeskn/wav2vec2-large-xls-r-300m-tr-cv16.1").to("cpu")
+processor = Wav2Vec2Processor.from_pretrained("rumeyskeskn/wav2vec2-large-xls-r-300m-tr-cv16.1")
+audio_path = "audio.wav"
+audio_array, sampling_rate = librosa.load(audio_path, sr=16000)
+input_values = processor(audio_array, sampling_rate=sampling_rate).input_values[0]
+input_dict = processor(input_values, return_tensors="pt", padding=True)
+logits = model(input_dict.input_values).logits
+pred_ids = torch.argmax(logits, dim=-1)
+prediction = processor.decode(pred_ids[0])
+print("Prediction:")
+print(prediction)
+```
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Wer    |