拼多多大模型

【一面】
1)介绍一个最能代表自己的项目
2)项目里负责的边界是什么?哪些内容是亲手实现/验证的?
3)电商领域预训练数据:低质过滤与去重会怎么做?用哪些简单指标快速判断数据质量?
4) Pretrain 和 SFT 分别解决什么问题?
5) Transformer 的基本结构怎么理解?
6)多模态模型的大致结构是什么(图像编码器+连接层+ LLM )?最容易踩坑的点通常在哪里?
7) SFT 数据如何更贴近业务:如何避免过度模板化?如何做基础的 train / test 去重来避免评测失真?
8)对齐( RLHF / DPO 等)整体思路是什么:为什么需要偏好对/奖励信号?
【二面】
1)做过的最有影响力的一件事是什么?具体推动了什么变化?
2)训练不稳定怎么排查( loss NaN 、 OOM 、吞吐下降)
3) Long Context 常见思路有哪些?在业务里如何做"能看长文本但不太贵"的折中(摘要/分段/滑窗等)?
4)如何做一套简单可执行的离线评测集?如何覆盖不同语言与类目?
5)多模态场景怎么评估:如何检查"图文一致性/不编造信息"?优先加哪些自动化检查?
6) Prompt /模板如何管理:如何版本化、如何回滚、如何避免一次改动导致整体波动?
7) 手撕:实现一个最简单的 top - k 采样(给定 logits /概率,取 top - k 后重新归一化采样),并说明边界情况怎么处理。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
感觉挺友好的?看那么多面经唯一一个几乎全会的
点赞 回复 分享
发布于 03-15 17:15 江苏

相关推荐

头像
04-15 10:28
湖南大学 安卓
研发/后端岗位对于普通开发岗,面试官主要考察你如何利用 AI 提效,以及是否具备“驾驭 AI”的能力。“你日常使用什么 AI 编程工具(Cursor/Copilot/通义灵码)?请举例说明你是如何用它们提升效率的?”“在使用 AI 生成代码后,你如何进行 Code Review?如何保证 AI 没有引入安全漏洞或幻觉 Bug?”场景题:现场出题:可能会要求你在10分钟内利用 AI 实现一个具体功能(如“实现一个淘宝首页”或“设计一个短链接系统”),重点看你的 Prompt 迭代过程和最终代码的可用性。调试能力:给一段报错的复杂代码,看你是否能利用 AI 快速定位根因,而不是盲目试错。算法/大模型岗位如果你面试的是算法岗,AI Coding 的门槛会非常高,不仅要会用,还要懂底层。底层原理与手写:手写算子:虽然允许用 AI,但可能会让你手写 Transformer 的核心模块(如 Self-Attention)、RoPE 旋转位置编码或 FlashAttention 的简化版。框架理解: “Megatron-LM 是如何实现 Tensor Parallel 的?”、“ZeRO 优化器的三个阶段分别解决了什么问题?”业务场景落地:电商场景: “在电商导购场景中,如何利用 RAG(检索增强生成)解决大模型幻觉问题?”、“如何设计一个支持海量用户实时聊天的系统?”数据处理: “如果让你用 AI 清洗 TB 级的电商评论数据,你会设计怎样的 Pipeline?”
查看13道真题和解析
点赞 评论 收藏
分享
评论
点赞
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务