拼多多日常实习 大模型算法一面分享

发点面经攒攒人品~
1.Pretrain 和 SFT 分别解决什么问题?
2.Transformer 的基本结构怎么理解?
3.多模态模型的大致结构是什么?最容易踩坑的点通常在哪里?
4.SFT 数据如何更贴近业务:如何避免过度模板化?如何做基础的 train / test 去重来避免评测失真?
5.对齐( RLHF / DPO 等)整体思路是什么:为什么需要偏好对/奖励信号?
6.玩过 Openclaw 吗?了解其的记忆机制吗?
7.如果检索返回了很多相关的内容,如何选择最相关的?
8.了解 embeding 吗?
9.了解过 spec-drivening 的 code agent 吗?
10.了解上下文压缩机制吗?
11.为什么压缩前 70%?最开始的几轮对话明确需求不是很重要吗?
全部评论
感觉问的似乎不多呀
点赞 回复 分享
发布于 04-16 23:23 北京

相关推荐

头像
04-15 10:28
湖南大学 安卓
研发/后端岗位对于普通开发岗,面试官主要考察你如何利用 AI 提效,以及是否具备“驾驭 AI”的能力。“你日常使用什么 AI 编程工具(Cursor/Copilot/通义灵码)?请举例说明你是如何用它们提升效率的?”“在使用 AI 生成代码后,你如何进行 Code Review?如何保证 AI 没有引入安全漏洞或幻觉 Bug?”场景题:现场出题:可能会要求你在10分钟内利用 AI 实现一个具体功能(如“实现一个淘宝首页”或“设计一个短链接系统”),重点看你的 Prompt 迭代过程和最终代码的可用性。调试能力:给一段报错的复杂代码,看你是否能利用 AI 快速定位根因,而不是盲目试错。算法/大模型岗位如果你面试的是算法岗,AI Coding 的门槛会非常高,不仅要会用,还要懂底层。底层原理与手写:手写算子:虽然允许用 AI,但可能会让你手写 Transformer 的核心模块(如 Self-Attention)、RoPE 旋转位置编码或 FlashAttention 的简化版。框架理解: “Megatron-LM 是如何实现 Tensor Parallel 的?”、“ZeRO 优化器的三个阶段分别解决了什么问题?”业务场景落地:电商场景: “在电商导购场景中,如何利用 RAG(检索增强生成)解决大模型幻觉问题?”、“如何设计一个支持海量用户实时聊天的系统?”数据处理: “如果让你用 AI 清洗 TB 级的电商评论数据,你会设计怎样的 Pipeline?”
查看13道真题和解析
点赞 评论 收藏
分享
评论
2
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务