开箱即用!一个功能丰富的 AI 语音工具箱!

来自问下公众号关注 “GitHub 宝典”

 

20240928130812557

当我们处理大量音频文件时,往往需要语音识别、转录甚至语音合成等多款工具协作完成工具。

这时候,要是有一款工具能够一站式解决从语音识别到语音合成的一切需求就好。

今天,我在 GitHub 上就发现了一款可本地部署的多功能 AI 语音工具箱:Easy Voice Toolkit

这款工具箱不仅涵盖了音频处理、语音转录,还能轻松生成定制的数据集,更厉害的是,它支持中文、英文和日文三种语言。

20240928130812529

安装起来也很简单,可以直接在本地运行,也可以在 Google Colab 上部署,甚至还有 Windows 的开箱即用安装包!

接下来,让我给大家详细介绍一下。

项目介绍

工具箱提供了包括语音模型训练在内的多种自动化音频工具,包括音频处理、语音识别、语音转录、数据集制作、模型训练、语音合成等。

大家可根据自己需求选择性的使用,或者通过组合使用这些工具,完成一次语音模型的训练。

目前各个工具对语言的支持情况如下:

20240928130813989

部署指南

本地部署:

  1. 环境要求 Python >= 3.8;

  2. 克隆项目,并进入项目目录;

git clone https://github.com/Spr-Aachen/Easy-Voice-Toolkit.git
cd Easy-Voice-Toolkit
阅读剩余
THE END