JulIus - 个人主页动态 - 牛客网

03-17 16:30

门头沟学院机器学习

滴滴大模型算法二面攒人品

攒人品中，祝大家都能拿到满意的Offer！1.让挑一个自己最拿手的项目介绍2.数据蒸馏的方法3.实践过程中有什么值得注意的点4.QWEN2的架构和训练方式5.LLM编码器和解码器的特点6.对强化学习的了解

查看6道真题和解析

0 点赞评论收藏

分享

03-14 06:35

门头沟学院机器学习

百度文心大模型算法实习一面

给我面没招了，感觉自己好菜、面试很难，还是要多多练习1、项目拷打2、DPO对齐训练的曲线是怎么样的，正例的概率会提升嘛3、Deepseek-R1里面不仅推理能力很好，而且文采能力也很好，这个是个开放问题，如何让模型的文采能力也很好呢4、DPO如何解决回答过长的问题，除了正则5、开放问题:为什么现在大家都在关注于大模型的推理能力reasoning6、对于一个basemodel如何增强大模型的reasoning能力7、模型选型时是否做定性定量对比abtest，客观数据验证文心性能不好了吗

查看6道真题和解析

0 点赞评论收藏

分享

03-07 11:20

门头沟学院机器学习

AI Agent淘天实习一面攒人品

继续来分享下之前的面经~欢迎友好讨论，信息共享1.请详细介绍一下Transformer的架构，包括Encoder和Decoder的区别？2.解释LayerNorm和BatchNorm的区别，为什么Transformer中使用LayerNorm？3.多头注意力机制的原理是什么？为什么要用多头而不是单头？4.LLaMA的结构有什么特点？与标准Transformer有什么不同？5.什么是位置编码？绝对位置编码和相对位置编码的区别是什么？6.大模型训练中的灾难性遗忘是什么？有哪些解决方法？7.大模型训练中数据量和数据质量哪个更重要？为什么？8.DeepFM的原理是什么？FM部分如何降低计算复杂度？9.你在项目中遇到过拟合的情况吗？是如何解决的？10.手撕代码：重排链表（LeetCode 143）

0 点赞评论收藏

分享

03-04 05:20

门头沟学院机器学习

快手实习 Ai Infra一面面经

祝大家都能拿到满意的Offer！1.实习介绍2.对岗位的理解3.Qwen模型占了多少内存，在上一段实习中如何部署的4.介绍模型量化和Flash attention，实际优化效果如何5.介绍Tensorrt，底层方面如何加速6.是否了解vllm框架，追问PagedAttention7.介绍实验室项目，模型参数量计算量怎么算的8.Pytorch核心的基础功能是什么，有试过Pytorch对GPU进行管理吗9.模型训练和推理在资源、消耗上的区别，是否了解模型训练过程中性能优化的手段10.GPU和CUDA有了解吗，GPU基础的物理执行单元是什么11.手撕力扣hot100：将有序数组转化为二叉搜索树

查看11道真题和解析

0 点赞评论收藏

分享

03-02 19:20

门头沟学院机器学习

oppo AI infra实习二面好难

发一下问题给大家参考，攒攒人品！有面试过同岗的朋友欢迎评论区交流项目拷打1. 数据布局详解：NHWC vs NCHW：在训练/推理中怎么选？2. 何时应该关闭 Shared Memory？（当出现 Bank Conflict 严重或收益不如直接访问 L2 时）3. 特定 Shape 导致使用 Shared Memory 时结果异常如何排查4. Thread/Warp/Block/SM/Grid 的映射关系5. 如何确定最优线程数？6. 异步设计：CUDA Stream 的使用前提（无内存访问重叠）7. 算子融合决策，什么场景适合融合

查看7道真题和解析

0 点赞评论收藏

分享

02-27 09:35

门头沟学院机器学习

百度 LLM算法校招二面强度拉满了

发一下问题给大家参考，攒人品中。。。1.实习中多智能体系统包含几个智能体?它们之间如何交互?2.实习中意图识别模型需要识别多少个意图?3.750B模型用于什么场景?4.实习中Qwen3VL模型是多少B的?用于什么场景?5.在实习中，你主要的贡献是什么?6.检索环节做了哪些优化?7.答案生成环节做了哪些优化?8.是否做了SFT或强化学习相关工作?在哪个环节做的?9.SFT过程中是否对类别标签做了清洗或修正?10.强化学习的样本量是多少?11.基础模型经常分类分不准的案例有哪些?12.在校项目中，为什么用对话数据来增强数据集?13.在校项目任务的输出可以简单描述并举例吗?14.单智能体能否完成相在校项目关工作?为什么要智能体？15.LangGraph相对其他开源智能体编排工具的优点是什么?16.在现有场景中是否需要用到LangGraph的状态管理功能?17.如何理解Long-termMemory的实现方式?18.若将电商场景中用户的购买、点击、兴趣等信息设计为长期记忆，有什么想法?19.Context Window能否储存大量电商交互信息?如何解决存储问题?20.推理时若将大量Memory以Token形式给到大模型，Token长度过长该如何处理?21.强化学习有哪些常用技巧?22.若通过SFT进一步提升模型准确率，常用的手段有哪些?23.SFT的理想数据量是多少?如何确定?24.SFT数据分布一般怎么取?为什么选择该分布而非其他分布?

查看24道真题和解析

0 点赞评论收藏

分享

02-13 11:30

门头沟学院机器学习

字节多模态大模型实习一面

发一下问题给大家参考，有面试过同岗的朋友欢迎评论区交流，攒人品中1.实习拷打2.知道 deepspeed 和 megatron 吗，分别介绍一下3.Decoder 文本生成有哪几种方法4.Attention 为什么要做scaled ，不做会怎么样，为什么用根号 d _ k5.说一下 Decoder 的因果注意力， QKV 分别来自哪6.深挖多模态大模型论文用的video - llama ，讲一下大模型的结构7.LoRA 初始化怎么做的，用的秩是多少，为什么不选其他的数8. 介绍一下 ALBEF 、 BLIP

查看7道真题和解析

0 点赞评论收藏

分享

02-12 03:50

门头沟学院机器学习

百度推荐算法实习二面被横线挂了

没招了，还是技不如人，还得练1、简历拷打2、HSTU用作encoder还是decoder？3、传统DLRM与生成式推荐的区别？4、SASRec了解吗，讲一下？5、Transformer 的encoder和decoder的区别？6、decoder的mask是怎么做的？7、HSTU的mask是怎么做的？8、HSTU 与Transformer的区别？9、了解过HSTU 源码中召回和排序是怎么做的吗？Code:1、交换链表两两之间的节点，分析时空复杂度。2、三数之和。

查看10道真题和解析

0 点赞评论收藏

分享

2025-08-28 20:25

门头沟学院机器学习

我感觉最后一题有简单的做法啊，为什么写了之后 wa 了

0 点赞评论收藏

分享

2025-08-28 16:10

门头沟学院机器学习

字节大模型算法工程师面经

自我介绍——5min项目相关细节提问——5min（对项目不是很感兴趣）项目相关技术提问——25min * 2面（与之前的面经贴中重复的技术问题不在展示）1. 了解 DeepSpeed 吗？训练时用 ZeRO 优化主要是解决啥问题？ZeRO 的三个阶段分别都是啥？2. TP 或 PP 了解吗？3. 并行训练时，如果模型参数量不大，怎么决定用 PP 还是 TP 策略？它们各自有啥好坏？4. 如果用 TP=2 的策略，self-attention 层里的 QKV 矩阵具体是怎么切分的？5. 用 TP 的时候，主要会发生哪些通信？不同的切分方式会改变通信行为吗？举个例子呗。6. 讲讲 Flash At...

查看7道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务