# VideoCaptioner - 大模型驱动的视频字幕处理工具

> 一站式视频字幕处理：语音识别、字幕优化、翻译、配音、烧录，免费功能安装即用

## VideoCaptioner — 基于大语言模型的视频字幕处理工具

**VideoCaptioner** 是一站式视频字幕处理工具，覆盖语音识别、字幕断句优化、翻译、配音、字幕烧录全流程。CLI + GUI 双模式，免费功能安装即用，无需任何 API Key。

### 核心功能

- **语音转录** — 支持 faster-whisper、Whisper API、必剪（免费）、剪映（免费）、whisper-cpp 等多种引擎
- **字幕优化** — LLM 语义理解断句，上下文感知翻译，支持反思优化机制
- **多语翻译** — 免费必应/谷歌翻译，也可接入 GPT/Claude 等大模型翻译
- **配音生成** — 根据字幕自动生成配音音轨或配音视频
- **字幕烧录** — 软字幕/硬字幕一键合成
- **视频下载** — 支持 YouTube、B站等平台

### 使用极简

```bash
pip install videocaptioner

# 全流程：转录 → 优化 → 翻译 → 合成（免费）
videocaptioner process video.mp4 --target-language ja

# 单独转录
videocaptioner transcribe video.mp4 --asr bijian

# 单独翻译字幕
videocaptioner subtitle input.srt --translator bing --target-language en
```

### 特色

- 词级时间戳 + VAD 语音活动检测，识别准确率高
- 免费功能（必剪识别、必应翻译）**零配置即用**
- 批量并发处理，效率高
- 提供 Claude Code Skill，AI 编程助手可直接调用
- GUI 桌面版 + CLI 命令行，灵活选择

### LLM 支持

仅字幕优化和大模型翻译需要 LLM，支持所有 OpenAI 兼容接口：SiliconCloud、DeepSeek、自建中转等。

许可证：GPL-3.0

---

**分类**：软件
**标签**：字幕 · 免费 · 翻译
**作者**：Xiao.Xi
**链接**：https://octohz.com/p/1808