MinerU - 文档解析引擎

MinerU - 文档解析引擎


将 PDF/Word/PPT 转为 LLM-ready Markdown,支持 109 种语言

MinerU 是高性能文档解析引擎,专为 LLM、RAG、Agent 工作流设计。

核心能力

  • 多格式支持:PDF、Word、PPT、图片、网页 → 结构化 Markdown/JSON
  • 高精度解析:公式转 LaTeX、表格转 HTML、布局精准重建
  • OCR 双引擎:VLM + OCR,支持扫描件、手写体、多栏布局
  • 109 种语言:全球主流语言全覆盖

集成生态

  • AI 编程工具:MCP Server(Cursor、Claude Desktop、Windsurf)
  • RAG 框架:LangChain、LlamaIndex、RAGFlow、Dify、FastGPT
  • 部署方式:Python/Go/TypeScript SDK、CLI、REST API、Docker
  • 国产芯片:支持昇腾、寒武纪、燧原等 10+ 家

开源地址:https://github.com/opendatalab/mineru

1500举报0Xiao.Xi18天前
点击获取 ^_^
被收录:

暂无评论