VideoCaptioner - 大模型驱动的视频字幕处理工具

VideoCaptioner - 大模型驱动的视频字幕处理工具


一站式视频字幕处理:语音识别、字幕优化、翻译、配音、烧录,免费功能安装即用

VideoCaptioner — 基于大语言模型的视频字幕处理工具

VideoCaptioner 是一站式视频字幕处理工具,覆盖语音识别、字幕断句优化、翻译、配音、字幕烧录全流程。CLI + GUI 双模式,免费功能安装即用,无需任何 API Key。

核心功能

  • 语音转录 — 支持 faster-whisper、Whisper API、必剪(免费)、剪映(免费)、whisper-cpp 等多种引擎
  • 字幕优化 — LLM 语义理解断句,上下文感知翻译,支持反思优化机制
  • 多语翻译 — 免费必应/谷歌翻译,也可接入 GPT/Claude 等大模型翻译
  • 配音生成 — 根据字幕自动生成配音音轨或配音视频
  • 字幕烧录 — 软字幕/硬字幕一键合成
  • 视频下载 — 支持 YouTube、B站等平台

使用极简

pip install videocaptioner

# 全流程:转录 → 优化 → 翻译 → 合成(免费)
videocaptioner process video.mp4 --target-language ja

# 单独转录
videocaptioner transcribe video.mp4 --asr bijian

# 单独翻译字幕
videocaptioner subtitle input.srt --translator bing --target-language en

特色

  • 词级时间戳 + VAD 语音活动检测,识别准确率高
  • 免费功能(必剪识别、必应翻译)零配置即用
  • 批量并发处理,效率高
  • 提供 Claude Code Skill,AI 编程助手可直接调用
  • GUI 桌面版 + CLI 命令行,灵活选择

LLM 支持

仅字幕优化和大模型翻译需要 LLM,支持所有 OpenAI 兼容接口:SiliconCloud、DeepSeek、自建中转等。

许可证:GPL-3.0

3500举报0Xiao.Xi22天前
点击获取 ^_^
被收录:

暂无评论