大模型应用面经,已归类!

全部评论
已老实
点赞 回复 分享
发布于 2025-07-03 17:01 上海

相关推荐

很多人问我如何准备大模型的面试,分享下我的经验,针对两种情况:1. 有大模型实习2. 无大模型实习针对无大模型实习的情况,我建议先找一段中厂实习为主,比如 zhipu、Minimax (当然有大厂进大厂)这些,相对容易进,尽量积累大模型实习经历。针对有大模型实习的情况,复习内容为:1. 常规八股(transformer、bert 等)2. 最新八股(GQA 等)3. 技术报告(一定要自己看原PDF,目前推荐 DeepSeekV3, R1, kimi1.5, Minimax-01, Qwen2.5, Qwen2.5-VL)4. 手撕 Leetcode:Hot1005. 手撕模型,比如 MHA 这些首先是常规八股和最新八股,这一部分可以自己找找网上资料,整理好的,背。然后是技术报告,目前推荐的内容有:1. DeepSeekV3:必读2. DeepSeekR1:必读3. Kimi1.5:选读4. Minimax-01:选读,据我所知最长上下文模型(外推到 4M,不过好像被 LLama4 的 10M 超过了)5. Qwen2.5:必读6. LLama3.1:必读7. Qwen2.5-VL(如果简历有多模态内容):选读重点关注:1. 阶段训练(预训练几段、Post-training 几段?上下文用了多少?数据配比是什么?)2. 模型创新点(MHA 创新是什么?作用是什么?)3. 上下文优化创新点(一般是优化显存和阶段训练)4. 多模态优化创新点(简历有多模态内容)5. 几个模型不同之处(比如 Qwen2 和 Qwen2.5 的不同之处)最后是手撕,Leetcode 只刷 Hot100 够了,模型手撕建议关注(我目前会的):1. MHA2. LayerNorm3. Transformer Encoder (MHA+LayerNorm+FFN)4. PE(绝对位置编码)5. ROPE6. SwiGLU7. RmsNorm每次面试前快速过一遍就 ok 了。
查看20道真题和解析
点赞 评论 收藏
分享
大模型浪潮下,不少26届同学想进军算法岗,却对岗位门槛、工作内容存在信息差。结合大半年实习经验,为大家揭秘真实行业情况,助力暑期与秋招规划。1️⃣大模型核心岗位划分大模型岗位主要分为两大方向:1. 大模型基座:涵盖数据、预训练、微调、对齐、训练/推理架构等工作。2. 大模型应用:包括数据、续训练、微调、对齐、推理部署、Agent、RAG等落地相关研发。2️⃣大模型岗位真实门槛很多人误以为无论文就无缘大模型,实际并非如此,实习与垂直经历比单纯论文更关键。1.基座岗位:学历要求高,基本为本硕双985,或国科大、北邮等强校,部分组要求博士;论文为硬性条件,至少1篇顶会起步,且方向需高度匹配;实习建议两段以上,优先阿里通义、字节豆包、百度文心、DeepSeek等头部机构。2.应用岗位:学历以本硕211及以上为主,是硕士主力赛道;论文非必需,仅为加分项,冲刺高薪计划可补充;更看重实习垂直性,无论文但项目对口,同样能拿到高薪offer。整体而言,求职时经历垂直匹配 > 含金量高低,弱相关经历加分十分有限。3️⃣大厂大模型工程师在做什么 大厂大模型工作并非大众想象中整日训模型、写代码,大量时间用于数据处理、评测与沟通。基座组多做小幅度结构优化与实验;应用组99%工作基于开源模型做续训、微调,搭建RAG、Agent系统,核心是调参、优化数据配比、制定自动化评估方案,最终目标是业务落地,能提升线上指标的方案才是有效方案。 想入局大模型,不必被论文门槛吓退,找准方向、深耕垂直项目,才是突围关键。如果找不到学习方向,需要辅导请私信联系。
点赞 评论 收藏
分享
评论
10
111
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务