LlamaIndex - 开源 LLM 应用框架与 RAG 数据增强工具包

LlamaIndex - 开源 LLM 应用框架与 RAG 数据增强工具包


从数据连接、索引构建到检索增强,支持 300+ 集成的 Python LLM 应用开发框架

项目简介

LlamaIndex 是一个开源的 LLM 应用框架,也被称为"数据框架"。它帮助开发者将私有数据与大语言模型结合,快速构建 RAG(检索增强生成)、文档智能体和知识问答系统。支持 OpenAI、Ollama、Hugging Face 等 300+ 集成。

核心功能

数据增强与 RAG

  • 数据连接器:支持 API、PDF、SQL、文档等多种数据源和格式
  • 索引构建:向量存储、图索引、检索器、重排序模块
  • 高级查询接口:任意 LLM 提示输入,返回检索上下文和知识增强输出
  • 持久化存储:支持磁盘持久化和加载

LlamaParse 企业平台

  • Parse:Agentic OCR 和文档解析(130+ 格式)
  • Extract:结构化数据提取
  • Index:数据摄取、索引和 RAG 流水线
  • Agents:基于 Workflows 和 Agent Builder 构建端到端文档智能体

快速使用

# 基础版
pip install llama-index

# 核心 + 自定义集成
pip install llama-index-core
pip install llama-index-llms-openai
pip install llama-index-llms-ollama
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader

documents = SimpleDirectoryReader("data").load_data()
index = VectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()
query_engine.query("你的问题")

技术特点

  • 两种使用模式:高级 API 5 行代码入门,低级 API 全模块可定制扩展
  • 300+ 集成包:在 LlamaHub 上找到各种 LLM、Embedding、向量存储提供商的插件
  • 多框架兼容:可与 LangChain、Flask、Docker、ChatGPT 等外部框架集成

适用场景

  • 企业知识库问答系统
  • 文档智能分析与结构化提取
  • 多模态 AI Agent 开发
  • 私有数据 + LLM 的 RAG 应用

GitHub: https://github.com/run-llama/llama_index 官网: https://llamaindex.ai

500举报0Xiao.Xi4天前
点击获取 ^_^
被收录:

暂无评论