项目介绍
VideoTranslator,一款开源的视频翻译工具,集成了OpenAI Whisper语音识别引擎和多种翻译API。
提供了一整套视频翻译解决方案,包括从视频中提取音频、进行语音识别、翻译文本、生成字幕以及导出视频等功能。
截图

核心功能
- 🎵 音频处理: 自动从视频中提取音频,支持多种音频格式
- 🗣️ 语音识别: 集成OpenAI Whisper引擎,支持多语言高精度语音转文本
- 🌐 智能翻译: 支持OpenAI、DeepL、Google等多种翻译API
- 📝 字幕编辑: 可视化字幕编辑器,支持时间轴调整和样式设置
- 🎬 视频导出: 支持字幕烧录和软字幕嵌入两种导出方式
- ⚡ 性能优化: 内存管理、多线程处理、检查点恢复机制
安装指南
1. 克隆项目
git clone https://github.com/YinChingZ/VideoTranslator.git cd VideoTranslator
2. 安装依赖
# 安装Python依赖 pip install -r requirements.txt # 安装FFmpeg (Windows) # 下载并安装FFmpeg,确保添加到PATH环境变量 # 安装FFmpeg (macOS) brew install ffmpeg # 安装FFmpeg (Ubuntu) sudo apt update sudo apt install ffmpeg
3. 配置API密钥
在应用程序设置中配置您的翻译API密钥:
OpenAI API密钥
DeepL API密钥
Google Translate API密钥
4. 运行应用程序
python main.py
使用流程
1. 视频导入
- 拖拽视频文件到应用窗口
- 或通过菜单选择视频文件
- 支持的格式: MP4, AVI, MOV, MKV等
2. 语言设置
- 选择源语言 (可自动检测)
- 选择目标语言
- 配置Whisper模型大小
3. 处理阶段
- 音频提取: 从视频中提取音频轨道
- 语音识别: 使用Whisper进行语音转文本
- 文本翻译: 调用翻译API进行文本翻译
- 字幕生成: 生成带时间轴的字幕文件
4. 字幕编辑
- 在字幕编辑器中调整时间轴
- 修改翻译文本
- 设置字幕样式和位置
5. 视频导出
- 选择导出格式 (硬字幕/软字幕)
- 设置视频质量参数
- 开始导出最终视频
链接
GitHub:https://github.com/YinChingZ/VideoTranslator
