Github 开源现在最好的TTS声音克隆

* 戳上方蓝字“牛皮糖不吹牛”关注我

    大家好,我是牛皮糖!F5-TTS 是一个基于流量匹配的文本到语音系统,旨在生成流畅且忠实的语音,特别适合童话故事机。它采用了 ConvNeXt V2 和扩散变换器,提升了训练和推理的速度。

安装

你可以选择以下几种方式进行安装:

  1. pip 包:直接安装用于推断。
    pip install git+https://github.com/SWivid/F5-TTS.git
阅读剩余
THE END