VideoCaptioner - 大模型驱动的视频字幕处理工具

一站式视频字幕处理：语音识别、字幕优化、翻译、配音、烧录，免费功能安装即用

VideoCaptioner — 基于大语言模型的视频字幕处理工具

VideoCaptioner 是一站式视频字幕处理工具，覆盖语音识别、字幕断句优化、翻译、配音、字幕烧录全流程。CLI + GUI 双模式，免费功能安装即用，无需任何 API Key。

核心功能

语音转录 — 支持 faster-whisper、Whisper API、必剪（免费）、剪映（免费）、whisper-cpp 等多种引擎
字幕优化 — LLM 语义理解断句，上下文感知翻译，支持反思优化机制
多语翻译 — 免费必应/谷歌翻译，也可接入 GPT/Claude 等大模型翻译
配音生成 — 根据字幕自动生成配音音轨或配音视频
字幕烧录 — 软字幕/硬字幕一键合成
视频下载 — 支持 YouTube、B站等平台

使用极简

pip install videocaptioner

# 全流程：转录 → 优化 → 翻译 → 合成（免费）
videocaptioner process video.mp4 --target-language ja

# 单独转录
videocaptioner transcribe video.mp4 --asr bijian

# 单独翻译字幕
videocaptioner subtitle input.srt --translator bing --target-language en

特色

词级时间戳 + VAD 语音活动检测，识别准确率高
免费功能（必剪识别、必应翻译）零配置即用
批量并发处理，效率高
提供 Claude Code Skill，AI 编程助手可直接调用
GUI 桌面版 + CLI 命令行，灵活选择

LLM 支持

仅字幕优化和大模型翻译需要 LLM，支持所有 OpenAI 兼容接口：SiliconCloud、DeepSeek、自建中转等。

许可证：GPL-3.0

3500举报0

Xiao.Xi•22天前

点击获取 ^_^

被收录：

字幕免费翻译

暂无评论