AI面试到底会问哪些问题?整理了3轮面经,附答题思路!

写在前面:AI面试一般分技术面行为面,大厂会有2~3轮技术面 + 1轮HR面。技术面以手撕代码 + 八股知识点为主,行为面主要考察项目经历和沟通能力。下面按模块整理高频题。

1、机器学习基础

请解释过拟合的成因以及你会如何处理?

几乎每家必问。答题时要涵盖:正则化(L1/L2)、Dropout、数据增强、Early Stopping、降低模型复杂度等。

BatchNorm 和 LayerNorm 的区别,各自适用场景?

CV 方向 BatchNorm 更常见;NLP/Transformer 中 LayerNorm 是标配。能对比 GroupNorm 加分。

梯度消失/爆炸是怎么产生的,有哪些解决思路?

从链式法则推导出原因,解决方案:残差连接、合理初始化(Xavier/He)、梯度裁剪、归一化。

2、大模型 / Transformer 专项

Attention 机制的原理,为什么要除以 √d_k?

重点:scaled dot-product attention 的计算流程;除以 √d_k 是为了缓解点积结果过大导致 softmax 进入饱和区的梯度消失问题。

大模型训练中 RLHF 的流程是什么?

分3步讲:SFT 监督微调 → Reward Model 训练 → PPO 强化学习优化。提到 DPO 作为替代方案会很加分。

如何用有限资源微调大模型?(LoRA / QLoRA)

LoRA 冻结原始权重,在旁路注入低秩矩阵;QLoRA 在此基础上加量化,显著降低显存占用。

KV Cache 是什么,有什么优化手段?

推理阶段缓存 Key/Value 避免重复计算;优化方向:Multi-Query Attention、Grouped-Query Attention、PagedAttention(vLLM)。

#AI面会问哪些问题?#
全部评论
总结的很好呢,看着不错
点赞 回复 分享
发布于 昨天 22:53 北京

相关推荐

03-24 02:07
已编辑
南开大学 Java
全程2小时共享屏幕+看项目具体代码,压力面算法题(40min+20min优化):74. 搜索二维矩阵      秒了1482. 制作 m 束花所需的最少天数贪心+二分    搞了半天,不过撕出来了问怎么优化时间复杂度1. TCP连接建立过程为何是3次segment交互,而非4次?请详细说明四次握手合并为三次的核心原因。2. 没见过的代码,让我猜结果,后来查了是js`const a = {i:1,toString: function(){return a.i++;}};console.log(a==1 && a==2 && a==3)`为何会输出 `true`?其底层类型转换和执行顺序是怎样的?3. 请解释CPU执行指令时,为何数字比较是串行执行而非并行处理?这和`a==1 && a==2 && a==3`的执行逻辑有何关联?4. 大模型生成语句基于HTTP长连接逻辑时,和WebSocket的全双工通信特性有何本质区别?5. SSE是否具备双工通信能力?如何清晰澄清SSE的单向推送特性?6. SSE实现客户端消息推送时,持续推送无法中断的问题该如何解决?是否需要后端配合实现流程控制?7. SSE存在自动断连风险,该如何优化协议稳定性以适配业务场景?有哪些重连或保活方案?8. 大模型流式输出的分段内容格式该如何设计?需要考虑哪些兼容性和可读性要求?9. 智能体Prompt的完整构建流程是怎样的?从角色设定、任务范围到格式化输出要求,具体步骤是什么?10. 智能体的场景化细节设计有哪些?该如何嵌入Prompt?11. AI Agent的核心工作流程是什么?请详细说明从用户需求分析、工具调用意图生成,到参数转化、MCP客户端校验执行的全链路。12. MCP调用逻辑的权限归属问题是什么?谁来主导MCP工具的调用?13. LangChain在你的项目中具体承担什么角色?是否仅作为大模型接口?如何实现框架的深度定制?14. 大模型在Agent系统中是思考核心,那工具调用的触发主体是谁?是Agent解析字符串触发,还是大模型主动分析意图后调用?15. 大语言模型输出字符串的机制是什么?工具调用的触发时机具体在哪个环节?16. Agent与大模型的协作流程是怎样的?17. MCP调用工具时的参数校验流程是怎样的?校验失败后该如何处理异常?18. MCP和Skill的功能边界是什么?两者在工具调用、模块化设计上有何区别?19. 如何将现有MCP工具改造为支持Skill功能?具体的代码或配置修改步骤是什么?20. 渐进式披露技术的具体实现方式是什么?如何通过文件格式和系统提示词控制大模型读取范围?21. 改造工具调用链路(如从MCP切换到skill接口)时,是否需要修改大模型本身?如何实现解耦以避免核心代码变动?22. 新建Scale工具文件并注册到映射体系的具体操作步骤是什么?如何保证工具调用的灵活性?23. 直接使用AI生成的代码方案(如Markdown表格形式的函数列表)是否可靠?存在哪些灵活性不足的问题?24. 现有文件名匹配逻辑不够完善,该如何优化?需要考虑哪些匹配规则和异常场景?25. 项目中的主控逻辑和记忆模块是否为自主实现?LangChain之外还使用了哪些技术栈?反问:一周出结果
冰炸橙汁_不做oj版:已吓哭
发面经攒人品
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务