筛选：

Happy-LLM - 从零开始构建大模型（Datawhale 开源教程）

Datawhale 开源的系统性 LLM 学习教程，从 NLP 基础到动手搭建 LLaMA2，再到训练实践与 RAG/Agent 应用

项目简介

Datawhale 开源的系统性 LLM 学习教程，从 NLP 基础概念出发，逐步深入 Transformer 架构、预训练语言模型、大语言模型原理与训练，直到动手搭建并训练一个完整的 LLaMA2 模型。

章节	关键内容	状态
第一章 NLP 基础概念	文本表示演进、任务分类	✅
第二章 Transformer 架构	注意力机制、手把手搭建 Transformer	✅
第三章预训练语言模型	Encoder-only / Encoder-Decoder / Decoder-Only 对比	✅
第四章大语言模型	LLM 定义、训练策略、涌现能力	✅
第五章动手搭建大模型	实现 LLaMA2、训练 Tokenizer、预训练小型 LLM	✅
第六章大模型训练实践	预训练、SFT、LoRA/QLoRA 高效微调	🚧
第七章大模型应用	模型评测、RAG、Agent 智能体	✅

大学生、研究人员、LLM 爱好者。建议具备 Python 基础和深度学习相关知识。

⭐ GitHub 29.4k+ | Datawhale 开源 | CC BY-NC-SA 4.0

2900举报0

Xiao.Xi•17天前

被收录：

暂无评论