Getting wrong transcriptions

#7
by DevOG - opened

Tried running the inference using the model on common voice dataset 11 was getting very weird trasncriptions with spacing and (matra) problems in hindi language , but still getting a decent WER of 10.
Any suggestions? (adding a few samples below)

First line is the transcription by the model and second line is the actual sentence from the dataset

नरदर म द क व र ध म स ह स नह और च ह न
नरेंद्र मोदी के विरोध में सिंह, सिन्हा और चौहान

र क गई अमरन थ य तर क ब द कशम र स ल टन लग ह त रथय तर
रोकी गई अमरनाथ यात्रा, एडवाइजरी के बाद कश्मीर से लौटने लगे हैं तीर्थयात्री

च धर व रदर स ह ब जप म श म ल हए
चौधरी बिरेंदर सिंह बीजेपी में शामिल हुए

म सटर व ल क उमम द सच न उठ त रहग ज ममद र
'मिस्टर वॉल' को उम्मीद सचिन उठाते रहेंगे जिम्मेदारी

बरफ कह ह
बर्फ कहाँ है?

Sign up or log in to comment