kotoba-tech
/

kotoba-whisper-v2.2

Automatic Speech Recognition

hf-asr-leaderboard

Inference Endpoints

Model card Files Files and versions Community

asahi417 commited on Oct 22

Commit

aa56a4f

•

1 Parent(s): 9d62abd

Upload KotobaWhisperPipeline

Files changed (1) hide show

kotoba_whisper.py +2 -2

kotoba_whisper.py CHANGED Viewed

@@ -263,8 +263,8 @@ class KotobaWhisperPipeline(AutomaticSpeechRecognitionPipeline):
             outputs["chunks"] += new_chunk
         outputs["speaker_ids"] = sorted(set([o["speaker_id"] for o in outputs["chunks"]]))
         for s in outputs["speaker_ids"]:
-            outputs[f"chunk/{s}"] = sorted([o for o in outputs["chunks"] if o["speaker_id"] == s], key=lambda x: x["timestamp"][0])
-            outputs[f"text/{s}"] = "".join([i["text"] for i in outputs[f"chunk/{s}"]])
             if postprocess_parameters["add_punctuation"]:
                 outputs[f"text/{s}"] = self.punctuator.punctuate(outputs[f"text/{s}"])
         return outputs

             outputs["chunks"] += new_chunk
         outputs["speaker_ids"] = sorted(set([o["speaker_id"] for o in outputs["chunks"]]))
         for s in outputs["speaker_ids"]:
+            outputs[f"chunks/{s}"] = sorted([o for o in outputs["chunks"] if o["speaker_id"] == s], key=lambda x: x["timestamp"][0])
+            outputs[f"text/{s}"] = "".join([i["text"] for i in outputs[f"chunks/{s}"]])
             if postprocess_parameters["add_punctuation"]:
                 outputs[f"text/{s}"] = self.punctuator.punctuate(outputs[f"text/{s}"])
         return outputs