# MinerU - 文档解析引擎 > 将 PDF/Word/PPT 转为 LLM-ready Markdown,支持 109 种语言 MinerU 是高性能文档解析引擎,专为 LLM、RAG、Agent 工作流设计。 ## 核心能力 - **多格式支持**:PDF、Word、PPT、图片、网页 → 结构化 Markdown/JSON - **高精度解析**:公式转 LaTeX、表格转 HTML、布局精准重建 - **OCR 双引擎**:VLM + OCR,支持扫描件、手写体、多栏布局 - **109 种语言**:全球主流语言全覆盖 ## 集成生态 - **AI 编程工具**:MCP Server(Cursor、Claude Desktop、Windsurf) - **RAG 框架**:LangChain、LlamaIndex、RAGFlow、Dify、FastGPT - **部署方式**:Python/Go/TypeScript SDK、CLI、REST API、Docker - **国产芯片**:支持昇腾、寒武纪、燧原等 10+ 家 开源地址:https://github.com/opendatalab/mineru --- **分类**:软件 **标签**:解析 · 语言 · MinerU **作者**:Xiao.Xi **链接**:https://octohz.com/p/1403