Практическое занятие
Настало время взять в руки несколько Аудио моделей и применить на практике то, чему вы научились. Это упражнение является одним из четырех практических упражнений, необходимых для получения сертификата об окончании курса.
Вот инструкции.
В этом блоке мы продемонстрировали дообучение модели Hubert на наборе данных marsyas/gtzan
для классификации музыки. Accuracy нашего примера составила 83%.
Ваша задача - улучшить этот показатель.
Вы можете выбрать любую модель на 🤗 Hugging Face Hub, которая, по вашему мнению, подходит для классификации аудио, и использовать
точно такой же набор данных marsyas/gtzan
для построения собственного классификатора.
Ваша цель - достичь accuracy 87% на этом наборе данных с помощью вашего классификатора. Вы можете выбрать точно такую же модель, поиграть с гиперпараметрами обучения или выбрать совершенно другую модель - все зависит от вас!
Чтобы ваш результат был засчитан в сертификат, не забудьте в конце обучения вывести модель на Hub, как это было показано в данном блоке,
со следующими **kwargs
:
kwargs = {
"dataset_tags": "marsyas/gtzan",
"dataset": "GTZAN",
"model_name": f"{model_name}-finetuned-gtzan",
"finetuned_from": model_id,
"tasks": "audio-classification",
}
trainer.push_to_hub(**kwargs)
Вот некоторые дополнительные ресурсы, которые могут оказаться полезными при работе над этим упражнением:
- Руководство по решению задач классификации звука в документации Transformers
- Документация по модели Hubert
- Документация по модели M-CTC-T
- Документация Audio Spectrogram Transformer
- Документация Wav2Vec2
Не стесняйтесь создавать демо-версию своей модели и делиться ею в Discord! Если у вас есть вопросы, задавайте их в канале #audio-study-group.
< > Update on GitHub