Transformers
PyTorch
Safetensors
Russian
t5
text2text-generation
PyTorch
Transformers
text-generation-inference
Instructions to use bond005/ruT5-ASR-large with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use bond005/ruT5-ASR-large with Transformers:
# Load model directly from transformers import AutoTokenizer, AutoModelForMultimodalLM tokenizer = AutoTokenizer.from_pretrained("bond005/ruT5-ASR-large") model = AutoModelForMultimodalLM.from_pretrained("bond005/ruT5-ASR-large") - Notebooks
- Google Colab
- Kaggle
Замечания
#2
by Dhanada - opened
проверил 5 случайных.
Loading weights: 100% 509/509 [00:00<00:00, 7348.40it/s]==========
Example 1
ASR output before restoring:
из за того что frontend и backend команды по сути почти не общались друг с другом event processing pipeline мало по малу начал обрастать какими то workaround механизмами
After restoring:
Из-за того, что Frontend и Backend команды, по сути, почти не общались друг с другом, event-payments, Pepeline, мало-по-малу, начал обрастать какими-то репродуктивными механизмами.
Example 2
ASR output before restoring:
в файле users_dump_2025-01-14.sql явно чего то не хватает проверь .gitignore и logs/
After restoring:
В файле http://users._dump_2025-01-14. sql. org явно чего-то не хватает. Проверяй gitsignori и logos.
Example 3
ASR output before restoring:
результаты получены методом ренгенофлуорисцентной спектрометрии в течении года мы закупали матерьялы и проводили иследования
After restoring:
Результаты, полученные методом рентгенофлуоресцентной спектрометрии. В течение года мы закупали материалы и проводили исследования.
Example 4
ASR output before restoring:
Дмитрий БРЕКОТКИН и Эльдар КАЛИМУЛИН приехали на сьемки в хороорах стреманулся
After restoring:
Дмитрий Брызгалов, Ткакин и Эльдар Калемулин приехали на съемки. В хоровод стреманулся.
Example 5
ASR output before restoring:
в общем то если не брать в расчет несколько совсем уж трудно объяснимых сценариев система работала более менее предсказуемо
After restoring:
В общем-то, если не брать в расчет несколько совсем уж трудно объяснимых сценариев, система работала более-менее предсказуемо.
Example 6
ASR output before restoring:
В ОБЩЕМ)))) все оказалось намного хуже чем казалось сначала 😭🚀🚀🚀 позвони мне
After restoring:
В общем, судя по всему, всё оказалось намного хуже, чем казалось сначала. Позвони мне.
Example 7
ASR output before restoring:
после запуска появилось NullPointerException at UserService.java:145 и все зависло
After restoring:
После запуска появилась Null Passive Reconnaissance at User Service (java:145) и всё зависло.
- Полная деградация на IT-терминах (Пример 1, 7)
event processing pipeline -> event-payments, Pepeline (Выдумала payments, исковеркала pipeline).
workaround механизмами -> репродуктивными механизмами (Полностью изменила смысл).
NullPointerException -> Null Passive Reconnaissance (Придумала термин из сферы кибербезопасности! Это безумная галлюцинация).
at UserService.java:145 -> at User Service (java:145) (Разбила имя класса, потеряла .java).
Почему это произошло: Модель не знает этих слов. Она пытается "угадать" их по фонетическому звучанию. Для нее workaround звучит похоже на какое-то русское слово, начинающееся с "репро...", и она подставляет его. - Уничтожение технических артефактов (Пример 2)
users_dump_2025-01-14.sql -> http://users._dump_2025-01-14. sql. org (Модель решила, что это URL, и превратила имя файла в домен).
.gitignore -> gitsignori (Исковеркала до неузнаваемости).
logs/ -> logos (Заменила на похожее по звучанию слово).
Почему это произошло: В ASR-датасетах нет имён файлов. Сталкиваясь с такой строкой, модель пытается применить знакомые ей паттерны. Она видит . и думает, что это домен. - Фантастические галлюцинации ФИО (Пример 4)
Дмитрий БРЕКОТКИН -> Дмитрий Брызгалов, Ткакин (Придумала ДВЕ фамилии из одной).
Эльдар КАЛИМУЛИН -> Эльдар Калемулин (Исковеркала).
в хороорах стреманулся -> В хоровод стреманулся (Полностью изменила смысл).
Почему это произошло: ASR-модели обучены разделять слова. Когда она видит слитный шум, она пытается разбить его на знакомые слова, даже если это абсурд.
✅ А теперь о хорошем: Пунктуация и чистовая орфография
И здесь она показала себя великолепно:
Пример 3: Идеально исправила рентгенофлуоресцентной, материалы, исследования и расставила знаки.
Пример 5: Идеально расставила запятую после В общем-то, дефис в более-менее.
Пример 6: Изящно избавилась от )))) и эмодзи, добавив связующее судя по всему, сделав текст связным.