# VideoCaptioner - 大模型驱动的视频字幕处理工具 > 一站式视频字幕处理:语音识别、字幕优化、翻译、配音、烧录,免费功能安装即用 ## VideoCaptioner — 基于大语言模型的视频字幕处理工具 **VideoCaptioner** 是一站式视频字幕处理工具,覆盖语音识别、字幕断句优化、翻译、配音、字幕烧录全流程。CLI + GUI 双模式,免费功能安装即用,无需任何 API Key。 ### 核心功能 - **语音转录** — 支持 faster-whisper、Whisper API、必剪(免费)、剪映(免费)、whisper-cpp 等多种引擎 - **字幕优化** — LLM 语义理解断句,上下文感知翻译,支持反思优化机制 - **多语翻译** — 免费必应/谷歌翻译,也可接入 GPT/Claude 等大模型翻译 - **配音生成** — 根据字幕自动生成配音音轨或配音视频 - **字幕烧录** — 软字幕/硬字幕一键合成 - **视频下载** — 支持 YouTube、B站等平台 ### 使用极简 ```bash pip install videocaptioner # 全流程:转录 → 优化 → 翻译 → 合成(免费) videocaptioner process video.mp4 --target-language ja # 单独转录 videocaptioner transcribe video.mp4 --asr bijian # 单独翻译字幕 videocaptioner subtitle input.srt --translator bing --target-language en ``` ### 特色 - 词级时间戳 + VAD 语音活动检测,识别准确率高 - 免费功能(必剪识别、必应翻译)**零配置即用** - 批量并发处理,效率高 - 提供 Claude Code Skill,AI 编程助手可直接调用 - GUI 桌面版 + CLI 命令行,灵活选择 ### LLM 支持 仅字幕优化和大模型翻译需要 LLM,支持所有 OpenAI 兼容接口:SiliconCloud、DeepSeek、自建中转等。 许可证:GPL-3.0 --- **分类**:软件 **标签**:字幕 · 免费 · 翻译 **作者**:Xiao.Xi **链接**:https://octohz.com/p/1808