hindi-speech-recognition-veda_intern-wav2vec2

Runtime error

Harveenchadha commited on Feb 6, 2023

Commit

c043038

•

1 Parent(s): 487d42a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -34,14 +34,22 @@ def resampler(input_file_path, output_file_path):
 def parse_transcription_with_lm(wav_file):
     input_values = read_file_and_process(wav_file)
     with torch.no_grad():
-        logits = model(**input_values).logits[0].cpu().numpy()
-    print(logits)
-    int_result = processor_with_LM.decode(logits = logits, output_word_offsets=False,
-                                         beam_width=128
-                                         )
-    print(int_result)
-    transcription =  int_result.text.replace('<s>','')
     return transcription

 def parse_transcription_with_lm(wav_file):
     input_values = read_file_and_process(wav_file)
+    # with torch.no_grad():
+    #     logits = model(**input_values).logits[0].cpu().numpy()
+    # print(logits)
+    # int_result = processor_with_LM.decode(logits = logits, output_word_offsets=False,
+    #                                      beam_width=128
+    #                                      )
+    # print(int_result)
+    # transcription =  int_result.text.replace('<s>','')
     with torch.no_grad():
+        logits = self.model(**input_values).logits
+    result = self.processor.batch_decode(logits.cpu().numpy())
+    text = result.text
+    transcription = text[0]
     return transcription