
从数据连接、索引构建到检索增强,支持 300+ 集成的 Python LLM 应用开发框架
项目简介
LlamaIndex 是一个开源的 LLM 应用框架,也被称为"数据框架"。它帮助开发者将私有数据与大语言模型结合,快速构建 RAG(检索增强生成)、文档智能体和知识问答系统。支持 OpenAI、Ollama、Hugging Face 等 300+ 集成。
核心功能
数据增强与 RAG
- 数据连接器:支持 API、PDF、SQL、文档等多种数据源和格式
- 索引构建:向量存储、图索引、检索器、重排序模块
- 高级查询接口:任意 LLM 提示输入,返回检索上下文和知识增强输出
- 持久化存储:支持磁盘持久化和加载
LlamaParse 企业平台
- Parse:Agentic OCR 和文档解析(130+ 格式)
- Extract:结构化数据提取
- Index:数据摄取、索引和 RAG 流水线
- Agents:基于 Workflows 和 Agent Builder 构建端到端文档智能体
快速使用
# 基础版
pip install llama-index
# 核心 + 自定义集成
pip install llama-index-core
pip install llama-index-llms-openai
pip install llama-index-llms-ollama
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
documents = SimpleDirectoryReader("data").load_data()
index = VectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()
query_engine.query("你的问题")
技术特点
- 两种使用模式:高级 API 5 行代码入门,低级 API 全模块可定制扩展
- 300+ 集成包:在 LlamaHub 上找到各种 LLM、Embedding、向量存储提供商的插件
- 多框架兼容:可与 LangChain、Flask、Docker、ChatGPT 等外部框架集成
适用场景
- 企业知识库问答系统
- 文档智能分析与结构化提取
- 多模态 AI Agent 开发
- 私有数据 + LLM 的 RAG 应用
GitHub: https://github.com/run-llama/llama_index 官网: https://llamaindex.ai
暂无评论
