VideoTranslator:智能视频翻译系统,支持提取音频、语音识别、翻译文本、生成字幕、导出视频等功能

项目介绍

VideoTranslator,一款开源的视频翻译工具,集成了OpenAI Whisper语音识别引擎和多种翻译API。

提供了一整套视频翻译解决方案,包括从视频中提取音频、进行语音识别、翻译文本、生成字幕以及导出视频等功能。

截图

VideoTranslator:智能视频翻译系统,支持提取音频、语音识别、翻译文本、生成字幕、导出视频等功能

核心功能

  • 🎵 音频处理: 自动从视频中提取音频,支持多种音频格式
  • 🗣️ 语音识别: 集成OpenAI Whisper引擎,支持多语言高精度语音转文本
  • 🌐 智能翻译: 支持OpenAI、DeepL、Google等多种翻译API
  • 📝 字幕编辑: 可视化字幕编辑器,支持时间轴调整和样式设置
  • 🎬 视频导出: 支持字幕烧录和软字幕嵌入两种导出方式
  • ⚡ 性能优化: 内存管理、多线程处理、检查点恢复机制

安装指南

1. 克隆项目

git clone https://github.com/YinChingZ/VideoTranslator.git cd VideoTranslator

2. 安装依赖

# 安装Python依赖 pip install -r requirements.txt # 安装FFmpeg (Windows) # 下载并安装FFmpeg,确保添加到PATH环境变量 # 安装FFmpeg (macOS) brew install ffmpeg # 安装FFmpeg (Ubuntu) sudo apt update sudo apt install ffmpeg

3. 配置API密钥

在应用程序设置中配置您的翻译API密钥:
OpenAI API密钥
DeepL API密钥
Google Translate API密钥
4. 运行应用程序

python main.py

使用流程

1. 视频导入

  • 拖拽视频文件到应用窗口
  • 或通过菜单选择视频文件
  • 支持的格式: MP4, AVI, MOV, MKV等

2. 语言设置

  • 选择源语言 (可自动检测)
  • 选择目标语言
  • 配置Whisper模型大小

3. 处理阶段

  • 音频提取: 从视频中提取音频轨道
  • 语音识别: 使用Whisper进行语音转文本
  • 文本翻译: 调用翻译API进行文本翻译
  • 字幕生成: 生成带时间轴的字幕文件

4. 字幕编辑

  • 在字幕编辑器中调整时间轴
  • 修改翻译文本
  • 设置字幕样式和位置

5. 视频导出

  • 选择导出格式 (硬字幕/软字幕)
  • 设置视频质量参数
  • 开始导出最终视频

链接

GitHub:https://github.com/YinChingZ/VideoTranslator

免责声明:

本站提供的资源,都来自网络,版权争议与本站无关,所有内容及软件的文章仅限用于学习和研究目的。不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,我们不保证内容的长久可用性,通过使用本站内容随之而来的风险与本站无关,您必须在下载后的24个小时之内,从您的电脑/手机中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。侵删请致信E-mail:i@zcjun.com

其他:  侵删处理  – 关于本站   –  版权声明  –  隐私政策

AI工具实用工具推荐

PPTAgent:开源AI文本转PPT幻灯片演示文稿项目,自行部署,模仿人制作PPT的方法,采用两步流程来确保整体质量卓越

2025-12-19 11:11:43

推荐趣站

WplAsst:在线将图像转换为像素艺术,帮助 Wplace 玩家轻松绘画,可免费用于个人或者商用

2025-12-24 9:15:58

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧