Zen3 TTS Voice Design

Zen3 TTS variant specialized for voice design: synthesize new speakers from natural-language descriptors (timbre, age, accent, affect) without reference audio. Part of the Zen3 audio family.

Hosted via Hanzo gateway

Served at api.hanzo.ai as zen3-tts-voice-design.

Weights

Mirror staging in progress. Use the canonical base via the base_model link in frontmatter until weights land here.

Acknowledgements

Built on Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign (Apache-2.0). Mirrored here for the Zen3 audio family.

Downloads last month: 32

Safetensors

Model size

2B params

Tensor type

BF16

Model tree for zenlm/zen-3-tts-voice-design

Base model

Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign

Finetuned

(42)

this model

Collection including zenlm/zen-3-tts-voice-design

Zen3 Audio

Collection

Speech recognition + text-to-speech. • 7 items • Updated 12 days ago