
Ingest, parse, and optimize any data format:PDF/Word/PPT/Excel、图片、音频、视频一键转结构化Markdown,专为GenAI框架优化
Omniparse 是一个开源数据解析框架,可将任意格式的文档、图片、音频、视频转换为 LLM 友好的结构化 Markdown 输出。\n\n支持格式:\n- 文档:PDF、Word、PPT、Excel\n- 图片:OCR 提取 + 表格识别\n- 音频:语音转文字\n- 视频:帧提取 + 语音转录\n\n输出为标准化 Markdown,直接喂给 RAG、Agent、Fine-tuning 等 GenAI 工作流。
暂无评论
