站点图标 Bccfxs - 北城分享社

CosyVoice - AI声音克隆离线整合包

CosyVoice-AI声音克隆离线整合包介绍

是一个由阿里开源的聚合多语言大语音生成模型项目。该项目提供了推理、训练和部署的全栈能力,并围绕FunAudioLLM核心框架展开。其中,SenseVoice和CosyVoice是该项目的两个主要模型,分别用于高精度多语言语音识别、情感识别和音频事件检测以及通过多语言、音色和情感控制进行自然语音生成。

这个项目已经公开在GitHub上,项目地址为https://github.com/FunAudioLLM/CosyVoice。此外,还提供了一个整合包下载链接:https://pan.quark.cn/s/74ce36f251b6,由up主十个骑士制作。

关于CosyVoice的具体功能,它可以用于多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟踪等。解压整合包并启动后,用户可以通过界面进行简单操作。其中有一个“预训练模式”可以直接进行文本生成语音。另外,“3s极速复刻”功能可以克隆一段音频的音色,用户只需上传音频文件并输出与音频内容一致的prompt,然后填入想要生成的文本即可。而“跨语种复刻”则允许用户克隆其他语言的音频。

详细的信息和更多功能,用户可以访问官方页面https://fun-audio-llm.github.io进行查看。这个整合包为用户提供了一个方便的工具,让他们能够利用CosyVoice-AI进行声音克隆和其他语音生成任务。

退出移动版