CA-Agent的backbone是Qwen-2.5-7b-Instruct,通过指定prompt格式,可以基于用户角色描述、上下文和TTS文本,生成控制TTS(Gemini-2.5 tts)的prompt,使其合成的声音不仅符合角色特点,还符合上下文语境。