Chenyme AAVT介绍

Chenyme AAVT是一个功能强大、使用简单的全自动视频/音频翻译工具。它可以快速识别声音并翻译生成字幕文件,然后将翻译后的字幕与原视频合并,生成翻译后的视频。该项目主要基于OpenAI的Whisper进行声音识别,支持多种语言,并利用LLMs如ChatGPT、KIMI、DeepSeek等进行字幕翻译,或使用本地大语言模型进行翻译。它还支持GPU加速和VAD辅助,提高了识别和翻译的效率。此外,该工具支持输出多种字幕格式,并提供字幕修改和预览功能,同时还支持对音频直接进行AI总结和问答。项目使用Streamlit搭建了一个快速使用的WebUI界面,并利用FFmpeg实现了字幕与视频的合并。总的来说,这是一个功能强大、使用简单的全自动视频/音频翻译工具,值得广大用户尝试使用。

Chenyme AAVT – 一个功能强大、使用简单的全自动视频/音频翻译工具-Bccfxs - 北城分享社

Chenyme AAVT地址

项目地址:https://github.com/Chenyme/Chenyme-AAVT

  1. 转载请保留原文链接谢谢!
  2. 本站所有资源文章出自互联网收集整理,本站不参与制作,如果侵犯了您的合法权益,请联系本站我们会及时删除。
  3. 本站发布资源来源于互联网,可能存在水印或者引流等信息,请用户擦亮眼睛自行鉴别,做一个有主见和判断力的用户。
  4. 本站资源仅供研究、学习交流之用,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担。
  5. 联系方式(#替换成@):bccfxs&proton.me