Audio Course documentation

Ünite 2. Ses uygulamalarına nazik bir giriş

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Ünite 2. Ses uygulamalarına nazik bir giriş

Hugging Face ses kursunun ikinci ünitesine hoş geldiniz! Daha önce, ses verilerinin temellerini keşfettik ve 🤗 Datasets ve 🤗 Transformers kütüphanelerini kullanarak ses veri kümesiyle nasıl çalışılacağını öğrendik. Örnekleme hızı, genlik, bit derinliği, dalga formu ve spektrogram gibi çeşitli kavramları tartıştık ve veriyi önceden eğitilmiş bir model için hazırlamak için nasıl işleyeceğimizi gördük.

Bu noktada, Transformers’ın gerçekleştirebileceği ses görevleri hakkında bilgi edinmek için istekli olabilirsiniz ve dalmak için gerekli tüm temel bilgilere sahipsiniz! Akıllara durgunluk veren bazı sesli görev örneklerine bir göz atalım:

  • Ses sınıflandırması: Ses kliplerini kolayca farklı kategorilere ayırın. Bir kaydın havlayan bir köpek mi yoksa miyavlayan bir kedi mi olduğunu ya da şarkının hangi müzik türüne ait olduğunu belirleyebilirsiniz.
  • Otomatik konuşma tanıma: Ses kliplerini otomatik olarak yazıya dönüştürerek metne dönüştürün. “Bugün nasılsın?” gibi konuşan birinin kaydının metin temsilini alabilirsiniz. Not almak için oldukça faydalı!
  • Konuşmacı günlüğü: Kayıtta kimin konuştuğunu hiç merak ettiniz mi? 🤗 Transformers ile herhangi bir anda hangi konuşmacının konuştuğunu bir ses klibinde belirleyebilirsiniz. Bir konuşma kaydında “Alice” ve “Bob”u ayırt edebildiğinizi hayal edin.
  • Metinden konuşmaya: sesli kitap oluşturmak, erişilebilirliğe yardımcı olmak veya bir oyundaki bir NPC’ye ses vermek için kullanılabilecek bir metnin anlatımlı bir versiyonunu oluşturun. 🤗 Transformers ile bunu kolayca yapabilirsiniz!

Bu ünite içinde, 🤗 Transformers’ın pipeline() işlevini kullanarak bazı görevler için önceden eğitilmiş modelleri nasıl kullanacağınızı öğreneceksiniz. Özellikle, önceden eğitilmiş modellerin nasıl ses sınıflandırması, otomatik konuşma tanıma ve ses üretme için kullanılabileceğini göreceğiz. Şimdi başlayalım!