站点图标 Bccfxs - 北城分享社

Chenyme AAVT - 一个功能强大、使用简单的全自动视频/音频翻译工具

Chenyme AAVT介绍

Chenyme AAVT是一个功能强大、使用简单的全自动视频/音频翻译工具。它可以快速识别声音并翻译生成字幕文件,然后将翻译后的字幕与原视频合并,生成翻译后的视频。该项目主要基于OpenAI的Whisper进行声音识别,支持多种语言,并利用LLMs如ChatGPT、KIMI、DeepSeek等进行字幕翻译,或使用本地大语言模型进行翻译。它还支持GPU加速和VAD辅助,提高了识别和翻译的效率。此外,该工具支持输出多种字幕格式,并提供字幕修改和预览功能,同时还支持对音频直接进行AI总结和问答。项目使用Streamlit搭建了一个快速使用的WebUI界面,并利用FFmpeg实现了字幕与视频的合并。总的来说,这是一个功能强大、使用简单的全自动视频/音频翻译工具,值得广大用户尝试使用。

Chenyme AAVT地址

项目地址:https://github.com/Chenyme/Chenyme-AAVT

退出移动版