wgs/F5-TTS-Faster · Hugging Face

F5-TTS Tensorrt-LLM Faster

为 F5-TTS 进行推理加速，测试样例如下：

经测试，推理速度由3.2s降低为0.72s, 速度提升 4 倍！

整个项目 workflow 可概述如下：

先将 F5-TTS 用 ONNX 导出，导出为三部分；
然后使用 Tensorrt-LLM 对有关 Transformer 部分进行网络的改写以便于加速，前端和decode仍使用ONNX推理，当然也可以指定CUDAExecutionProvider、OpenVINOExecutionProvider等。

本仓库存储模型权重，包括 torch、ONNX、trtllm。

详细请看（项目构建、权重转换、快速推理）：https://github.com/WGS-note/F5_TTS_Faster

F5-TTS 的学习笔记也会发，敬请期待，公众号：WGS的学习笔记

开源不易，欢迎 star

特别感谢以下两个开源项目的贡献：