from transformers import Text2SpeechForConditionalGeneration, Wav2Vec2ForSequenceClassification

# Cargar un modelo para síntesis de voz
model = Text2SpeechForConditionalGeneration.from_pretrained("nombre_del_modelo")

# Cargar un modelo para reconocimiento de voz
model = Wav2Vec2ForSequenceClassification.from_pretrained("nombre_del_modelo")