爱吃花椒的🐱酱

2023-09-21 20:50 上海交通大学机器学习

关注

阿里算法面经（已OC）

阿里面经：
一面（约40分钟）：
深挖项目细节，主要是实习的项目
问是否了解怎样进行分布式训练，模型并行，数据并行，异步与同步等等

二面（约30-40分钟）：
介绍一下自己的项目，并没有追问很多
还有就是对GPT的了解有多少
是否了解RLHF
场景题，如果让你做大模型的RLHF，你会怎么训练reward model

HR面（约50分钟）：
阿里的HR给我的感觉是相当专业的，而且非常有耐心
首先自我介绍，结束后会挑他感兴趣的去问
例如高考成绩，考研，学校和专业的选择等等
然后可能会重点问你的实习经历，根据你的情况具体发问。
然后就是经典的“项目或者实习中遇到过什么困难，是怎么解决的”
还会问你有没有对象啊，对工作地点有没有要求呀什么的
小问题挺多的很多我不太记得了
随后反问环节他详细介绍了一下部门的历史和现在主要的业务，还是挺认真的

全部评论

推荐最新楼层

想当offer收割机的托尼很慢热

中国科学院大学算法工程师

佬阿里哪个集团啊

1 回复分享

发布于 2023-09-23 12:19 北京

闲下来就去旅游的牛牛

门头沟学院算法工程师

佬能说一下时间线嘛？

1 回复分享

发布于 2023-09-22 21:49 湖北

爱信等到了节子

门头沟学院风险管理

楼主是面的什么岗位啊？阿里有强化学习相关的岗位吗

1 回复分享

发布于 2023-09-22 21:43 浙江

牛魔_击剑yes

江苏联合职业技术学院 ARM工程师

佬本科哪里的？

点赞回复分享

发布于 2023-11-20 00:35 北京

文一西路黄焖鸡

字节跳动_算法工程师

佬是hr面结束后多久oc的

点赞回复分享

发布于 2023-09-22 20:39 安徽

内向的乌龟被加薪

门头沟学院 C++

佬是啥部门，只有两轮技术吗

点赞回复分享

发布于 2023-09-22 15:02 浙江

科科科科科大侠

华东理工大学算法工程师

阿里没有手撕吗佬

点赞回复分享

发布于 2023-09-22 11:10 上海

03-09 15:13

吉林农业大学算法工程师

AI-Agent 面试题汇总 - 大模型篇

一、大语言模型基础1. 目前主流的开源模型体系有哪些？主流开源模型体系包括：LLaMA 系、Qwen 系、GLM/ChatGLM 系、Mistral/Mixtral 系、Baichuan 系、DeepSeek 系、InternLM、Yi 等。面试里建议从以下维度比较：参数规模（7B/13B/70B…）上下文长度（8K/32K/128K…）多语言能力工具调用能力（function calling / agent）推理成本与部署难度开源协议（是否可商用）2. Prefix LM 和 Causal LM 区别是什么？Causal LM：严格自回归，token 只能看左侧历史（下三角 mask）。Pr...

AI-Agent面试实战...

点赞评论收藏

分享

03-02 19:39

浙江工业大学深度学习

一面： 1. 自我介绍，讲论文和实习。2. Transformer自注意力机制、位置编码、梯度消失/爆炸的解决方案。3. 微调方法对比（Full Fine-tuning vs. LoRA/Adapter/P-Tuning）。4. 推理加速技术（量化、动态批处理、FlashAttention）。5. 如何优化大模型在长文本生成中的显存占用？6. RLHF中奖励模型（RM）的训练数据如何构建？7. 为网易云音乐设计一个AI歌词生成系统，如何提升创意性和押韵效果？8. 模型剪枝/量化（GPTQ、AWQ）、服务化框架（FastAPI+vLLM）。9. 如何解决大模型API服务的响应延迟问题？一面八股挺多的，问的知识点也非常多，主要考察对大模型的理解，整体来说难度不算大，复习熟记八股应该都比较好答。二面：1. 自我介绍，讲论文和实习。2. LayerNorm和BatchNorm在大模型中的区别？为什么Transformer用LayerNorm？3. 解释大模型训练中的“灾难性遗忘”现象及解决方法。4. 如果微调后的模型过拟合，你会如何调整？5. 如何评估一个对话系统的生成质量？6. 如何用大模型提升网易新闻的推荐效率？7. 设计一个游戏内AI陪玩系统，需考虑哪些模块？8. 领域适配时，如何构建高质量的垂域训练集？9. 你在项目中如何解决数据稀缺问题？10. 模型上线后遇到了什么性能瓶颈？如何优化的？建议：精读《Attention Is All You Need》、HuggingFace文档。如果没有大模型项目，可用Kaggle/开源项目复现（如LangChain应用）。

查看18道真题和解析

点赞评论收藏

分享

02-26 03:30

中南大学算法工程师

腾讯大模型实习面经感觉还可以

整体面试还是不错的，发下面经给大家参考～1.实习介绍2.在微调大模型时使用过哪些框架3.CLIP模型的zero-shot能力是如何实现的？4.Transformer中Pre-Norm和Post-Norm的设计差异是什么？对模型训练稳定性和性能有何影响？5.在生成式大模型（如LLaMA、GPT）中，为何通常采用Decoder-only架构而非Encoder-Decoder结构？6.请描述大模型中自然语言理解模块的具体实现方案，包括语义解析和意图识别的关键技术。7.针对Transformer模型推理过程，会采用哪些优化手段8.请阐述检索增强生成（RAG）的核心原理，并说明如何通过RAG缓解大模型的幻觉问题。9.vLLM框架的核心优化原理是什么？其在动态批处理和显存管理上有哪些创新设计？10请对比RLHF、PPO、DPO算法的技术差异、优缺点及适用场景

查看10道真题和解析

点赞评论收藏

分享

02-28 08:30

门头沟学院机器学习

字节AI算法二面好难啊

发点面经攒攒人品1、你在线上或离线训练时，过拟合怎么处理？直接说你最有效的三个方法和拿到的收益。2、把 BN 讲透：原理是什么；训练期和推理期用的统计量有何不同；跟 LN、GN 比，分别什么时候用、怎么取舍。3、分类和回归你最常用哪些损失？你更偏好哪几个，为什么（从鲁棒性、梯度、数值稳定性上谈）。4、L1 和 L2 正则你怎么选？它们各自的效果与风险是什么，工程里你是怎么权衡的。5、二元和多分类的交叉熵你怎么写？在工程里你怎么做数值稳定实现。6、AUC 到底在统计上代表什么？你怎么计算它，在线上业务里你如何解释“这次 AUC 提升”的含义。7、你做 CTR/CVR/CTCVR 联合建模时，ESMM/ESMM2 是怎么推导与工程落地的？线上到底带来了什么收益。8、Transformer 里因果注意力的 Q/K/V 各从哪来？Mask 具体怎么实现。9、Scaled Dot‑Product Attention 为啥要除以 √dk？如果不除会出什么数值或训练问题。10、把 Transformer / Decoder‑only 的整体结构过一遍，各个组件分别在干什么，有哪些常见变体。11、位置编码这条线你怎么选：绝对 PE、相对 PE、RoPE 各自的思路、优势和局限，结合你的项目谈取舍。12、长上下文怎么搞？Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力，你的实战方案是什么。13、KV Cache 在训练和推理中的差异是什么？它的加速价值有多大，吞吐与延迟你是如何权衡的，vLLM/paged‑attention 需要注意什么。14、PEFT 方案里（LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter）你怎么选？说说稳定训练的经验。15、SFT 和对齐（RLHF/DPO/IPO/PPO）原理差在哪？在不同数据与资源条件下，你怎么选路线。16、RAG 系统你怎么设计？切分、索引、召回/重排、压缩/融合、兜底策略怎么串。17、提示词工程你是怎么搞的？System/角色/约束/分步指令怎么写，如何防越狱

查看17道真题和解析

点赞评论收藏

分享

03-10 08:30

门头沟学院人工智能

腾讯实习大模型算法一面面经

给我面没招了，发点面经攒攒人品～1.介绍一下你的实习经历和主要工作内容。2.在微调大模型时，你使用过哪些框架？它们的优缺点分别是什么？3.CLIP 模型的 zero-shot 能力是如何实现的？它在多模态任务中的应用有哪些优势？4.Transformer 中 Pre-Norm 和 Post-Norm 的设计差异是什么？对模型训练稳定性和性能有何影响？5.在生成式大模型中，为何通常采用 Decoder-only 架构而非 Encoder-Decoder 结构？6.请描述大模型中自然语言理解模块的具体实现方案，包括语义解析和意图识别的关键技术。7.针对 Transformer 模型推理过程，你会采用哪些优化手段？8.请阐述RAG的核心原理，并说明如何通过 RAG 缓解大模型的幻觉问题。9.vLLM 框架的核心优化原理是什么？其在动态批处理和显存管理上有哪些创新设计？10.请对比 RLHF、PPO、DPO 算法的技术差异、优缺点及适用场景。

查看10道真题和解析

点赞评论收藏

分享

评论

9

21

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛友の3月总结 #

4563次浏览 40人参与

# Vibe Coding 会干掉初级岗位吗？ #

1720次浏览 37人参与

# 招商银行数字金融训练营 #

41531次浏览 490人参与

# 大厂实习和小厂实习最大的区别是什么？ #

5686次浏览 35人参与

# 你现在一天AI几次？ #

692次浏览 32人参与

# 如果人生可以debug你会改哪一行? #

833次浏览 25人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

20092次浏览 350人参与

# 做完笔试后你收到面试了吗？ #

1510次浏览 23人参与

# 找AI工作可以去哪些公司？ #

20214次浏览 924人参与

# 你都用vibe coding做过什么？ #

651次浏览 23人参与

# 如果可以选，你最想从事什么工作 #

763765次浏览 4895人参与

# 从事AI岗需要掌握哪些技术栈？ #

16998次浏览 1032人参与

# 金三银四，你的春招进行到哪个阶段了？ #

25477次浏览 300人参与

# 你做过最难的笔试是哪家公司 #

51245次浏览 930人参与

# 你觉得技术面多长时间合理？ #

176516次浏览 1204人参与

# AI面会问哪些问题？ #

39399次浏览 1256人参与

# 哪些公司真双非友好？ #

70873次浏览 294人参与

# 中国电信笔试 #

33434次浏览 303人参与

# 携程笔试 #

141019次浏览 842人参与

# 这些公司卡简历很严格 #

95476次浏览 419人参与

# 拼多多集团-PDD笔试 #

40144次浏览 365人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

343822次浏览 2194人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务