Uygulamalı eğitim egzersizleri
Bu egzersiz notlandırılmamıştır ve amacı, kursun geri kalanında kullanacağınız araçlar ve kütüphaneler hakkında bilgi sahibi olmanıza yardımcı olmaktır. Eğer Google Colab, 🤗 Datasets, librosa ve 🤗 Transformers gibi araçları kullanmada zaten deneyimliyseniz, bu egzersizi atlamayı seçebilirsiniz.
- Bir Google Colab not defteri oluşturun.
- Akış modunda seçtiğiniz dilde
facebook/voxpopuli
veri kümesinin tren bölümünü yüklemek için 🤗 Veri Kümeleri’ni kullanın. - Veri kümesinin “eğitim” kısmından üçüncü örneği alın ve inceleyin. Bu örneğin sahip olduğu özellikler göz önüne alındığında, bu veri kümesini ne tür ses görevleri için kullanabilirsiniz?
- Bu örneğin dalga formunu ve spektrogramını çizin.
- 🤗 Hub’a gidin, önceden eğitilmiş modelleri keşfedin ve daha önce seçtiğiniz dil için otomatik konuşma tanıma için kullanılabilecek bir model bulun. Bulduğunuz modelle karşılık gelen bir ardışık düzeni örnekleyin ve örneği yazıya dökün.
- İşlem hattından aldığınız transkripsiyonu örnekte verilen transkripsiyonla karşılaştırın.
Bu alıştırmada zorlanıyorsanız örnek çözüme göz atmaktan çekinmeyin. İlginç bir şey mi keşfettiniz? Harika bir model mi buldunuz? Güzel bir spektrogramınız mı var? Çalışmalarınızı ve keşiflerinizi Twitter’da paylaşmaktan çekinmeyin!
Sonraki bölümlerde çeşitli ses dönüştürücü mimarileri hakkında daha fazla bilgi edinecek ve kendi modelinizi eğiteceksiniz!