Spaces:

camparchimedes
/

nb

Running

camparchimedes commited on Aug 9, 2024

Commit

49351f8

verified ·

1 Parent(s): 77f2e6a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -68,9 +68,7 @@ def convert_to_wav(audio_file):
 # @spaces.GPU(duration=300, queue=False)
 # Set distinct pad and eos tokens
 if processor.tokenizer.pad_token_id is None:
-    processor.tokenizer.pad_token_id = processor.tokenizer.convert_tokens_to_ids("[PAD]")
-if processor.tokenizer.eos_token_id is None:
-    processor.tokenizer.eos_token_id = processor.tokenizer.convert_tokens_to_ids("[EOS]")
 def transcribe_audio(audio_file, batch_size=4):
     start_time = time.time()
@@ -92,7 +90,7 @@ def transcribe_audio(audio_file, batch_size=4):
                 inputs.input_features,
                 max_length=2048,
                 num_beams=8,
-                task="transcribe",
                 attention_mask=attention_mask,
                 language="no",
                 pad_token_id=processor.tokenizer.pad_token_id,

 # @spaces.GPU(duration=300, queue=False)
 # Set distinct pad and eos tokens
 if processor.tokenizer.pad_token_id is None:
+    processor.tokenizer.pad_token_id = processor.tokenizer.eos_token_id + 1
 def transcribe_audio(audio_file, batch_size=4):
     start_time = time.time()
                 inputs.input_features,
                 max_length=2048,
                 num_beams=8,
+                # task="transcribe",
                 attention_mask=attention_mask,
                 language="no",
                 pad_token_id=processor.tokenizer.pad_token_id,