nvidia
/

canary-1b

@@ -335,7 +335,8 @@ Another recommended option is to use a json manifest as input, where each line i
     "taskname": "asr",  # use "ast" for speech-to-text translation
     "source_lang": "en",  # language of the audio input, set `source_lang`==`target_lang` for ASR, choices=['en','de','es','fr']
     "target_lang": "en",  # language of the text output, choices=['en','de','es','fr']
-    "pnc": "yes",  # whether to have PnC output, choices=['yes', 'no']
 }
 ```
@@ -367,7 +368,8 @@ An example manifest for transcribing English audios can be:
     "taskname": "asr",
     "source_lang": "en", # language of the audio input, set `source_lang`==`target_lang` for ASR, choices=['en','de','es','fr']
     "target_lang": "en", # language of the text output, choices=['en','de','es','fr']
-    "pnc": "yes",  # whether to have PnC output, choices=['yes', 'no']
 }
 ```
@@ -384,7 +386,8 @@ An example manifest for transcribing English audios into German text can be:
     "taskname": "ast",
     "source_lang": "en", # language of the audio input, choices=['en','de','es','fr']
     "target_lang": "de", # language of the text output, choices=['en','de','es','fr']
-    "pnc": "yes",  # whether to have PnC output, choices=['yes', 'no']
 }
 ```

     "taskname": "asr",  # use "ast" for speech-to-text translation
     "source_lang": "en",  # language of the audio input, set `source_lang`==`target_lang` for ASR, choices=['en','de','es','fr']
     "target_lang": "en",  # language of the text output, choices=['en','de','es','fr']
+    "pnc": "yes",  # whether to have PnC output, choices=['yes', 'no']
+    "answer": "na",
 }
 ```
     "taskname": "asr",
     "source_lang": "en", # language of the audio input, set `source_lang`==`target_lang` for ASR, choices=['en','de','es','fr']
     "target_lang": "en", # language of the text output, choices=['en','de','es','fr']
+    "pnc": "yes",  # whether to have PnC output, choices=['yes', 'no']
+    "answer": "na",
 }
 ```
     "taskname": "ast",
     "source_lang": "en", # language of the audio input, choices=['en','de','es','fr']
     "target_lang": "de", # language of the text output, choices=['en','de','es','fr']
+    "pnc": "yes",  # whether to have PnC output, choices=['yes', 'no']
+    "answer": "na"
 }
 ```