
一站式视频字幕处理:语音识别、字幕优化、翻译、配音、烧录,免费功能安装即用
VideoCaptioner — 基于大语言模型的视频字幕处理工具
VideoCaptioner 是一站式视频字幕处理工具,覆盖语音识别、字幕断句优化、翻译、配音、字幕烧录全流程。CLI + GUI 双模式,免费功能安装即用,无需任何 API Key。
核心功能
- 语音转录 — 支持 faster-whisper、Whisper API、必剪(免费)、剪映(免费)、whisper-cpp 等多种引擎
- 字幕优化 — LLM 语义理解断句,上下文感知翻译,支持反思优化机制
- 多语翻译 — 免费必应/谷歌翻译,也可接入 GPT/Claude 等大模型翻译
- 配音生成 — 根据字幕自动生成配音音轨或配音视频
- 字幕烧录 — 软字幕/硬字幕一键合成
- 视频下载 — 支持 YouTube、B站等平台
使用极简
pip install videocaptioner
# 全流程:转录 → 优化 → 翻译 → 合成(免费)
videocaptioner process video.mp4 --target-language ja
# 单独转录
videocaptioner transcribe video.mp4 --asr bijian
# 单独翻译字幕
videocaptioner subtitle input.srt --translator bing --target-language en
特色
- 词级时间戳 + VAD 语音活动检测,识别准确率高
- 免费功能(必剪识别、必应翻译)零配置即用
- 批量并发处理,效率高
- 提供 Claude Code Skill,AI 编程助手可直接调用
- GUI 桌面版 + CLI 命令行,灵活选择
LLM 支持
仅字幕优化和大模型翻译需要 LLM,支持所有 OpenAI 兼容接口:SiliconCloud、DeepSeek、自建中转等。
许可证:GPL-3.0
暂无评论
