from transformers import Text2SpeechForConditionalGeneration, Wav2Vec2ForSequenceClassification # Cargar un modelo para síntesis de voz model = Text2SpeechForConditionalGeneration.from_pretrained("nombre_del_modelo") # Cargar un modelo para reconocimiento de voz model = Wav2Vec2ForSequenceClassification.from_pretrained("nombre_del_modelo")