clu-ling
/

whisper-large-v2-spanish-5k-steps

Automatic Speech Recognition

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

elsayedissa commited on Mar 3, 2023

Commit

bf091e3

•

1 Parent(s): dc098aa

Update README.md

Files changed (1) hide show

README.md +0 -2

README.md CHANGED Viewed

@@ -83,7 +83,6 @@ input_features = processor(sample["array"], sampling_rate=sample["sampling_rate"
 predicted_ids = model.generate(input_features.to(device), forced_decoder_ids=forced_decoder_ids)
 # decode
-transcription = processor.batch_decode(predicted_ids)
 transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)
 print(transcription)
@@ -121,7 +120,6 @@ dataset = dataset.cast_column("audio", Audio(sampling_rate=16000))
 #print(dataset)
 def normalize(batch):
-  """Normalizes GOLD"""
   batch["gold_text"] = whisper_norm(batch['sentence'])
   return batch

 predicted_ids = model.generate(input_features.to(device), forced_decoder_ids=forced_decoder_ids)
 # decode
 transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)
 print(transcription)
 #print(dataset)
 def normalize(batch):
   batch["gold_text"] = whisper_norm(batch['sentence'])
   return batch