≡ AI专栏
浙江大学《大模型基础》大模型基础教材(PDF文件)
《大模型基础》全面介绍大语言模型(LLMs)的基础知识、架构设计、训练优化及应用实践。从语言模型的基础理论出发,深入探讨基于统计、RNN和Transformer的模型架构,重点分析大语言模型的架构类型(如Encoder-only、Encoder-Decoder、Decoder-only)及其代表模型(如BERT、T5、GPT系列)。书中详细讲解Prompt工程、参数高效微调、模型编辑和检索增强生成等关键技术,结合实际案例展示这些技术在不同场景中的应用。通过系统的学习和实践指导,帮助读者深入理解、有效应用大语言模型技术。