Добро пожаловать на аудиокурс Hugging Face!
Уважаемый слушатель,
Добро пожаловать на курс по использованию трансформеров в аудио. Трансформеры снова и снова доказывают, что они являются одной из наиболее мощных и универсальных архитектур глубокого обучения, способных достигать передовых результатов в широком спектре задач, включая обработку естественного языка, компьютерное зрение, а с недавних пор и аудио.
В этом курсе мы рассмотрим, как трансформеры могут быть применены к аудиоданным. Вы узнаете, как использовать их для решения ряда задач, связанных с аудио. Если вас интересует распознавание речи, классификация аудиоданных или генерация речи из текста, трансформеры и данный курс помогут вам в этом.
Чтобы вы могли оценить возможности этих моделей, произнесите несколько слов в демонстрации ниже и посмотрите, как модель транскрибирует их в режиме реального времени!
В ходе курса вы получите представление о специфике работы с аудиоданными, узнаете о различных архитектурах трансформеров, а также обучите свои собственные аудио трансформеры, используя мощные предварительно обученные модели.
Этот курс рассчитан на слушателей, имеющих опыт глубокого обучения и общее представление о трансформерах. Знаний в области обработки аудиоданных не требуется. Если вам нужно подтянуть свое понимание трансформеров, ознакомьтесь с нашим курсом по NLP, в котором очень подробно рассматриваются основы трансформеров.
Знакомство с командой курса
Санчит Ганди, инженер-исследователь в области машинного обучения в Hugging Face
Привет! Меня зовут Санчит, и я работаю инженером-исследователем в области машинного обучения звука в Open Source команде компании Hugging Face 🤗. Основным направлением моей работы является автоматическое распознавание речи и перевод, а текущей целью - сделать речевые модели более быстрыми, более легкими и простыми в использовании.
Маттиджс Холлеманс, инженер по машинному обучению в Hugging Face
Меня зовут Маттиджс, я работаю инженером по машинному обучению аудио в команде Hugging Face с открытым исходным кодом. Я также являюсь автором книги о том, как писать звуковые синтезаторы, а в свободное время создаю аудиоплагины.
Мария Халусова, отдел документации и курсов в Hugging Face
Меня зовут Мария, и я создаю образовательный контент и документацию, чтобы сделать библиотеку Transformers и другие инструменты с открытым исходным кодом еще более доступными. Я раскрываю сложные технические концепции и помогаю людям начать работу с передовыми технологиями.
Вайбхав Шривастав, ML-разработчик, инженер по продвижению интересов разработчиков в компании Hugging Face
Меня зовут Вайбхав и я являюсь инженером по продвижению интересов разработчиков в области аудио в Open Source команде компании Hugging Face. Я занимаюсь исследованиями в области аудио с низким потреблением ресурсов и помогаю продвигать передовые исследования в области обработки речи в массы.
Структура курса
Курс состоит из нескольких разделов, в которых подробно рассматриваются различные темы:
- Раздел 1: охватывает специфику работы с аудиоданными, включая методы обработки аудиоданных и их подготовку.
- Раздел 2: познакомит с аудиоприложениями и научит использовать конвейеры 🤗 Transformers для решения различных задач, таких как классификация аудио и распознавание речи.
- Раздел 3: познакомит с архитектурами аудио трансформеров, расскажет, чем они отличаются и для каких задач лучше всего подходят.
- Раздел 4: научит создавать собственный классификатор музыкальных жанров.
- Раздел 5: углубится в распознавание речи и построение модель для расшифровки записей совещаний.
- Раздел 6: научит генерировать речь из текста.
- Раздел 7: научит создавать реальные аудиоприложения с использованием трансформеров.
Каждый раздел включает в себя теоретическую часть, где вы получите глубокое понимание основных концепций и методов. На протяжении всего курса мы предлагаем тестовые задания, которые помогут вам проверить свои знания и закрепить полученные навыки. Некоторые главы также включают практические упражнения, где вы сможете применить полученные знания.
К концу курса вы получите прочную базу в области использования трансформеров для аудиоданных и будете хорошо подготовлены к применению этих методов для решения широкого круга задач, связанных с аудио.
Разделы курса будут выходить несколькими последовательными блоками со следующим графиком публикации:
Раздел | Дата публикации |
---|---|
Раздел 0, Раздел 1, и Раздел 2 | 14 июня 2023 |
Раздел 3, Раздел 4 | 21 июня 2023 |
Раздел 5 | 28 июня 2023 |
Раздел 6 | 5 июля 2023 |
Раздел 7, Раздел 8 | 12 июля 2023 |
Траектории обучения и сертификация
Не существует правильного или неправильного способа изучения этого курса. Все материалы данного курса являются 100% бесплатными, общедоступными и открытыми. Вы можете изучать курс в удобном для вас темпе, однако мы рекомендуем проходить его по порядку.
Если вы хотите получить сертификат по окончании курса, мы предлагаем два варианта:
Тип сертификата | Требования |
---|---|
Сертификат о прохождении обучения | Выполнить 80% практических заданий в соответствии с инструкциями. |
Cертификат c отличием | Выполнить 100% практических заданий в соответствии с инструкциями. |
В каждом практическом упражнении указаны критерии его выполнения. Если вы выполнили достаточное количество практических упражнений, чтобы претендовать на получение сертификата, обратитесь к последнему разделу курса, чтобы узнать, как его получить. Удачи!
Зарегистрироваться на курс
Разделы этого курса будут выходить постепенно в течение нескольких недель. Мы рекомендуем вам подписаться на обновления курса, чтобы не пропустить появление новых разделов. Учащиеся, подписавшиеся на обновления курса, также первыми узнают о специальных социальных мероприятиях, которые мы планируем проводить.
Наслаждайтесь курсом!
< > Update on GitHub