LLMs 相关知识及面试题
简介
本仓库为大模型面试相关概念,由本人参考网络资源整理,欢迎阅读,如果对你有用,麻烦点一下 🌟 star,谢谢!
为了在低资源情况下,学习大模型,进行动手实践,创建 tiny-llm-zh仓库,旨在构建一个小参数量的中文大语言模型,该项目已部署,可以在如下网站上体验:ModeScope Tiny LLM。
动手实践项目:
- tiny-llm-zh : 从零实现一个小参数量的中文大语言模型,快速掌握大模型预训练、微调、RL等相关技术;
- tiny-rag : 实现一个简单的RAG系统,支持多路召回、重排等功能,快速了解搜索相关内容;
- tiny-mcp : 使用 Prompt 和 Function Calling 实现 MCP (模型上下文协议)服务端和客户端,快速使用MCP搭建Agent项目。
- llama3-from-scratch-zh : 从零实现 llama3, 可加载 meta 官方权重,可在本地笔记本(16G内存)调试运行
其他学习资源推荐:
- AI 工程师八股 : 包含深度学习、机器学习、推荐系统、搜索系统等通用知识
在线阅读
在线阅读链接:LLMs Interview Note
注意:
相关答案为自己撰写,若有不合理地方,请指出修正,谢谢!
欢迎关注微信公众号,会不定期更新LLM内容,以及一些面试经验:
目录
- 首页
- 真实面试题
- 01.大语言模型基础
- 1.1 大模型发展历程
- 1.2 分词与词向量
- 1.3 语言模型基础知识
- Word2Vec
- NLP三大特征抽取器(CNN/RNN/TF)
- NLP面试题
- [LLM为什么Decoder only架构](</01.大语言模型基础/LLM为什么Decoder only架构/LLM为什么Decoder only架构.md> "LLM为什么Decoder only架构")
- 1.4 深度学习
- 1.5 一些题目
- 02.大语言模型架构
- 2.1 Transformer模型
- 2.2 注意力
- 2.3 解码部分
- [解码策略(Top-k & Top-p & Temperature)](</02.大语言模型架构/解码策略(Top-k & Top-p & Temperatu/解码策略(Top-k & Top-p & Temperature).md> "解码策略(Top-k & Top-p & Temperature)")
- 2.4 BERT
- 2.5 常见大模型
- llama系列模型
- chatglm系列模型
- [llama 2代码详解](</02.大语言模型架构/llama 2代码详解/llama 2代码详解.md> "llama 2代码详解")
- [llama 3](</02.大语言模型架构/llama 3/llama 3.md> "llama 3")
- 2.6 MoE
- 1.MoE论文
- 2.MoE经典论文简牍
- [3.LLM MoE :Switch Transformers](</02.大语言模型架构/3.LLM MoE :Switch Transformers/3.LLM MoE :Switch Transformers.md> "3.LLM MoE :Switch Transformers")
- 03.训练数据集
- 04.分布式训练
- 05.有监督微调
- 06.推理
- 07.强化学习
- 08.检索增强RAG
- 09.大语言模型评估
- 10.大语言模型应用
- 98.相关课程
- 99.参考资料