CosyVoice - AI声音克隆离线整合包

北城

4 月前

CosyVoice-AI声音克隆离线整合包介绍

是一个由阿里开源的聚合多语言大语音生成模型项目。该项目提供了推理、训练和部署的全栈能力，并围绕FunAudioLLM核心框架展开。其中，SenseVoice和CosyVoice是该项目的两个主要模型，分别用于高精度多语言语音识别、情感识别和音频事件检测以及通过多语言、音色和情感控制进行自然语音生成。

这个项目已经公开在GitHub上，项目地址为https://github.com/FunAudioLLM/CosyVoice。此外，还提供了一个整合包下载链接：https://pan.quark.cn/s/74ce36f251b6，由up主十个骑士制作。

关于CosyVoice的具体功能，它可以用于多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟踪等。解压整合包并启动后，用户可以通过界面进行简单操作。其中有一个“预训练模式”可以直接进行文本生成语音。另外，“3s极速复刻”功能可以克隆一段音频的音色，用户只需上传音频文件并输出与音频内容一致的prompt，然后填入想要生成的文本即可。而“跨语种复刻”则允许用户克隆其他语言的音频。

详细的信息和更多功能，用户可以访问官方页面https://fun-audio-llm.github.io进行查看。这个整合包为用户提供了一个方便的工具，让他们能够利用CosyVoice-AI进行声音克隆和其他语音生成任务。

CosyVoice-AI声音克隆离线整合包介绍

猜你喜欢