
上传音视频,AI 自动整理成结构化 Markdown 笔记
项目简介
AudioNotes 是一款基于 FunASR 语音识别和 Qwen2 大模型的音视频转结构化笔记系统。上传音视频文件后,AI 自动提取内容并整理成一份结构化的 Markdown 笔记,方便快速阅读。
核心功能
| 模块 | 说明 |
|---|---|
| 音视频识别 | 基于 FunASR 快速提取音视频语音内容 |
| AI 笔记整理 | 调用 Qwen2 大模型将语音内容整理为结构化 Markdown |
| 内容对话 | 支持与音视频内容进行对话问答 |
| 本地部署 | 基于 Ollama + Docker,数据完全本地 |
技术栈
| 技术 | 说明 |
|---|---|
| FunASR | 阿里巴巴开源语音识别框架 |
| Qwen2 (Ollama) | 本地运行大模型进行笔记整理 |
| Chainlit | 交互式对话界面 |
| FFmpeg | 音视频处理 |
| PostgreSQL | 数据存储 |
| Docker | 一键部署 |
适用场景
- 会议录音/网课视频快速转文字笔记
- 播客/访谈内容结构化整理
- 视频内容检索与对话问答
- 追求数据隐私的本地音视频处理需求
Stars
约 2,000 Stars,Python
暂无评论
