成就我的未来

02-11 15:30 中南大学算法工程师

关注

快手校招大模型算法面经感觉好难

最近闲下来了发点面经攒攒人品
1. attention中数据shape是batch first还是seq_len first
2. Prompt长度加倍，首token延迟加倍吗
3. 模型选型时是否做定性定量对比ab test，客观数据验证文心性能不好了吗
4. SFT过程中遇到了哪些问题和解决方案？
5. 如何定性定量评估数据集质量，单条和整体数据集质量？
6. 单一分类模型，细分分类模型和MOE融合的优劣。
7. MHA手写?

全部评论

推荐最新楼层

门头沟学院模拟IC设计

文心性能不好这种话也敢在面试说，勇士，respect

点赞回复分享

发布于 02-12 13:41 上海

宁夏医科大学生物制药岗

好人一生平安

点赞回复分享

发布于 02-12 13:41 宁夏

牛客求职路

门头沟学院 Java

感觉自己是来给快手大模型做技术答辩的

点赞回复分享

发布于 02-12 13:40 北京

03-31 00:18

广西大学算法工程师

小鹏大模型算法一面

1. 介绍一下你做的这个项目2. LoRA 的基本原理是什么LoRA 的核心思路是，微调大模型时没有必要把整个权重矩阵都更新掉，而是只学习一个低秩的增量。原始权重记作 (W)，微调后的权重写成：其中 (A) 和 (B) 的秩都很低，参数量远小于直接更新整个 (W)。训练时冻结原模型参数，只训练这两个小矩阵，这样显存占用、优化器状态和保存体积都会小很多。它适合做领域适配、指令微调这类任务，因为很多任务对模型的改动并不需要覆盖完整参数空间。LoRA 常见会插在 attention 的 q_proj、v_proj 上，有时也会加在 k_proj、o_proj 或 MLP 层。选哪些层，本质上是在表达...

AI-Agent面试实战...

点赞评论收藏

分享

03-27 11:40

门头沟学院算法工程师

蚂蚁实习大模型算法一面 1h

发点面经攒攒人品～1.项目介绍2.介绍实习3.数据集使用的是公开数据集还在有自己构造数据集大模型相关八股提问4.分别讲一下 Dense 模型和 MoE 模型以及二者的区别5.讲一下MoE的 路由机制是如何做的6.训练完验证使用的是什么数据集7.做这个工作的过程中的难点在哪8.如何做的 SFT9.介绍一下 PPO10.讲一下 RAG 项目11.分类任务常用的评测指标有哪些12.讲一下 LoRA 微调的原理13.A、B 矩阵怎么初始化的14.LoRA 微调秩设置的是多少coding最小生成树

查看15道真题和解析

点赞评论收藏

分享

03-31 11:15

门头沟学院算法工程师

小红书大模型算法春招二面

继续来分享下之前的面经~欢迎友好讨论，信息共享1- RAG痛点2- 检索精度与召回率的平衡（如chunk粒度优化） 如何解决多跳推理问题？3- 知识更新机制（小红书UGC内容高频更新如何应对4- LLM针对RAG的优化5- 是否用LLM直接生成Embedding？如何解决生成式检索的稳定性6- 提示工程优化（如HyDE技术在小红书的应用场景）。7- 幻觉问题8- 检索结果置信度过滤方案？是否引入知识图谱作为验证层9- 检索污染处理10- 用户生成内容（如错误美妆知识）如何清洗？实时性（如突发谣言）如何应对11- 图文对RAG产品设计12- 多模态检索方案（图文联合Embedding vs. 分离对齐）13- 如何将用户评论/标签纳入检索增强

查看13道真题和解析

点赞评论收藏

分享

03-25 08:30

西安交通大学算法工程师

阿里大模型算法面经分享

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1.项目拷打2.你在去部署或者训练预训练或者后训练的模型时，有没有用过一些比较底层的一些训练的调试的工具，比如说千卡的话很容易就会出NCCL timeout，如果出现 NCCL timeout，一般怎么定位和解决？3.像那种rl里面的那个MOE之类的那种的优化有去做过吗4.看您的训练经验比较丰富，而且您上线运行的推理内容之前也进行过一些什么样的优化吗？5.有没有做过 kernel级别的优化？比如用 CUTE DSL或者手写 CUDA去做 fusion这类算子融合优化，介绍一下6像底层，如果你们在做.kernel fusion，倾向于用什么方式来做7.有没有哪次你做了 fusion 结果性能反而下降的？原因是什么8.平时写 CUDA的时候，有没有关注到底层实现细节？比如你刚提到 FA2，那再往下一层，像 Hopper架构里那个 warp specialization是什么，它底层大概是怎么实现的9.试过用 Agent去生成cuda内核么，怎么去做的10.如果我把 warp specialization 去掉，只保留 tile 和 shared memory 优化，大概会损失在哪？11.怎么么判断一个 MoE 模型是真的学到了分工，而不是只是把 dense模型拆开了12.在 RL + MoE 里，有没有遇到过 reward把 routing学坏的情况？就是模型为了拿 reward，全都走某几个 expert，这种情况你当时是怎么处理的

查看11道真题和解析

点赞评论收藏

分享

03-30 10:20

门头沟学院算法工程师

阿里大模型应用算法强化学习方向面经

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1.项目拷打2.实习拷打3. 多轮对话超长上下文如何训练4. 上下文记忆策略5. Skills读取超长sop的优化有哪些trick

查看5道真题和解析

点赞评论收藏

分享

评论

点赞

9

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 从投递到OC，你用了多久 #

4645次浏览 39人参与

# 总结:哪家公司最喜欢泡池子 #

169502次浏览 603人参与

# 厦门银行科技岗值不值得投 #

19328次浏览 427人参与

# 我的求职进度条 #

994420次浏览 6583人参与

# 哪些公司面试还在问八股？ #

1117次浏览 21人参与

# 哪一刻你突然觉得实习“有点值了” #

3215次浏览 44人参与

# HR面都在聊什么？ #

1235次浏览 21人参与

# 实习教会我的事 #

73958次浏览 511人参与

# 一人一道大厂面试题 #

129419次浏览 1321人参与

# 生物制药/化工校招攻略 #

85822次浏览 347人参与

# 实习生如何通过转正 #

136233次浏览 1488人参与

# 哪些公司一直卡在简历筛选 #

108263次浏览 374人参与

# 大厂无回复，继续等待还是奔赴小厂 #

350592次浏览 2009人参与

# 实习生活中那些难忘的瞬间 #

333411次浏览 3399人参与

# 现在还是0offer，延毕还是备考 #

1365025次浏览 7953人参与

# 我想象的实习vs现实的实习 #

333260次浏览 2298人参与

# 有深度的简历长什么样？ #

54259次浏览 732人参与

# 反问环节如何提问 #

138708次浏览 2734人参与

# 夸夸我的求职搭子 #

262012次浏览 1983人参与

# 入职第一天，你准备什么时候下班 #

118605次浏览 519人参与

# 拿到offer之后，可以做些什么 #

105949次浏览 514人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务