
MinerU - 文档解析引擎
将 PDF/Word/PPT 转为 LLM-ready Markdown,支持 109 种语言
MinerU 是高性能文档解析引擎,专为 LLM、RAG、Agent 工作流设计。
核心能力
- 多格式支持:PDF、Word、PPT、图片、网页 → 结构化 Markdown/JSON
- 高精度解析:公式转 LaTeX、表格转 HTML、布局精准重建
- OCR 双引擎:VLM + OCR,支持扫描件、手写体、多栏布局
- 109 种语言:全球主流语言全覆盖
集成生态
- AI 编程工具:MCP Server(Cursor、Claude Desktop、Windsurf)
- RAG 框架:LangChain、LlamaIndex、RAGFlow、Dify、FastGPT
- 部署方式:Python/Go/TypeScript SDK、CLI、REST API、Docker
- 国产芯片:支持昇腾、寒武纪、燧原等 10+ 家
暂无评论
