算法打工人小旺

08-09 13:30 中山大学算法工程师发布于山东

关注

快手．大模型应用一二面

🍓一面时长约50min，面试官很和蔼，体验感还不错。
1．面试官先简单介绍了下团队，然后是自我介绍；
2．拷打了一下项目和论文；
3．为什么多头注意力能提升表达能力？
4．为什么要在大模型中使用 RMSNorm ？和 LayerNorm 有什么差异？
5.LoRA和 PromptTuning 有何区别，分别适用于什么场景？
6．模型微调时遇到过过拟合吗？怎么处理的？
7．大模型推理时的加速思路？
8.KV Cache 是怎么起作用的？为什么对长上下文推理很关键？算法题手撕：
字符串的全排列。
二叉树序列化与反序列化。
✅面试感受：整体提问节奏比较平稳，面试官很有亲和力，有的地方卡住了还会给提示。
🍓二面时长约40min，主要是针对简历进行深挖。
1．自我介绍。
2．深挖项目，针对项目思路不断追问。
3．大模型生成内容如何做去重过滤？
4．如果词表特别大（10w+ token ), Softmax 加速通常有哪些实现？
5．如果要在中文领域做 Instruction Tuning ，需要注意哪些数据问题？
6．反问
✅面试感受：二面的氛围和一面截然不同，面试官提问非常犀利，没有太多套路问题，并且对细节很关注。
📳对于想求职算法岗的同学，如果想参加高质量项目辅导，提升面试能力，欢迎后台联系。

全部评论

推荐最新楼层

上海交通大学算法工程师

同学，瞅瞅我司，医疗独角兽，校招刚开，名额有限，先到先得，我的主页最新动态，绿灯直达，免笔试～

1 回复分享

发布于 08-28 19:38 广东

08-28 19:02

已编辑

哈尔滨工业大学（深圳）算法工程师

快手大模型应用算法三面挂

本来以为快手是推的最快的那家，没想到三面一拖再拖最后还是挂了……tl：一面：8.7 面完第二天中午约二面二面：8.12 面完第二天发三面邀请 时间是8.18周末重新接到了面试邀请，时间改到8.198.19面试前5分钟，hr打电话说面试官出差了，约到8.25三面：8.25 问了下项目的角色，问了些场景题，然后开始聊天，比如兴趣、老家、规划、有没有别的offer，面完面试官说他们会横向一下于是，8.27早上一看，官网已经结束流程了，无电话通知无感谢信快手你好狠的心，再捞我我也不面了，三面挂阴影太大了这周有四家三面（主管面），目前周一面的快手已经挂了，周二雷火主管面，我问到是否还有下一面时回答道接下...

李橙子：有机会还是挺好的

点赞评论收藏

分享

09-03 20:48

龙岩学院护士

美团大模型应用二面凉经

攒个人品，秋招不指望了，希望春招能有机会上岸吧。------------------------------------------------------没有自我介绍环节，一上来直接拷打实习，边拷打边问八股，基本上是我说一个做的东西，然后面试官就要开始问对应的八股了，记录一下问的八股：1. Qwen 与传统的Transformer模型相比，有什么结构上的改进？2. RMSNorm相较于LayerNorm有什么优势？公式是什么？3. SwiGLU的公式是什么？4. GRPO的公式是什么，这样做为什么更好？5. KL散度的公式是什么，为什么要用KL散度？6. LLM的损失函数是什么？给你一个10w的词表，计算出事的损失值7. GRPO为什么要做clip，直接用SFT后的模型还会不稳定吗？优势度可以怎样改进？8. 为什么你要用GRPO？GPRO结果比之前好多少？显存开销多大？训练一个Step需要多久？奖励函数如何设置的，为什么？有没有想过为什么一开始Reward出现大幅度震荡？GRPO是否一定有效，还有什么解决方法？9. Post-Training 的工作机制，为什么要做三阶段训练？什么情况下应该用GRPO？为什么DeepSeek用了GRPO？如何从V3到R1？10. 微调是如何进行微调的？为什么LoRA能够work？除了LoRA外，还了解哪些微调方法？11. 后训练用的哪个框架？你用过什么框架？如何使用deepspeed进行分布式训练？脚本是你自己写的吗？12. 知道什么Linux命令？13. 用过C++，Java吗？平时用什么多?14. 如何去评价你工作的产出和质量（基本上每个面试官都会问）15. FLUX的工作原理，LoRA在这个地方起到了什么作用？16. 你认为实习过程中哪些是从零到一的工作？（全部！鼠鼠之前学地理的）遇到一个不熟悉的领域，你会如何进行学习？-------------------------------------------------------大概是这些，可能不是很全手撕：删除链表中的节点；快慢指针秒了反问：面试官先介绍了下部门业务，随后反问：1. 为啥初试后又是初试？（可以自己点的，实际上就是二面）2. 后续几轮面试呢？（三轮，还有大老板面）3. 工作强度 （8-9.30左右）4. 这个岗位需要什么样的人？ （努力学习新知识，耐心）总而言之美团的面试体验真没的说，面试官会笑这一点就值得夸了，全程没啥压力，但是估计凉了，有些没答好

查看17道真题和解析

点赞评论收藏

分享

09-12 18:41

东华大学产品经理

百度AI产品经理面经

面的是 AI 产品，面试过程算比较舒服，大体都能答上来。面试过程：1. 上来先是自我介绍，我说了大概两分钟左右。2. 问简历上实习过的 AI 项目。项目的核心目标是什么，是服务于成交率吗？3. 对比 chatgpt、文心一言、通义等 AI 大模型的优缺点。4. 对 agent、rag、function call 等大模型技术的理解。5. 如何平衡多轮对话的轮数和用户体验？6. 如何评估项目效果？7. 多轮对话解决的实际用户问题是什么？

查看7道真题和解析

点赞评论收藏

分享

09-15 16:46

门头沟学院算法工程师

📍面试公司：快手💻面试岗位：大模型❓面试问题：1. ppo，dpo，grpo是什么各种的优劣2. ppo中gae的计算3. dpo的数据要怎么做4. 对于grpo有什么改进的思路，dapo和gspo分别怎么做的5. dpo如果正确和错误都下降怎么办6. 分层强化学习要怎么具体设计agent的思路7. reward怎么训练8. reward hacking是怎么出现的，要怎么解决9. 计算7b模型的占用10. fddp和deepspeed怎么做显存优化11. adamw中最占显存的是什么12. 手撕一个MHA

查看12道真题和解析

点赞评论收藏

分享

09-19 14:15

阿里云_JAVA研发工程师(准入职员工)

阿里云内推，阿里云内推码

产品岗真实工作体会~ 我所在的产品线整体风格不卷，加班不严重，周末大家都安排自己的生活，可以安心放下手机，也让我彻底放下“不秒回羞耻症” 阿里云团队规模太大，分工很细，人也很多，想搞清楚一件事情要对接好多好多人，要熟悉的流程也贼多，这个过程的确有些累，但我估计只要在大厂都会这样 感觉这边做事情自由度更高，换句话说，老板只要结果，过程怎么做自己想办法去 凡事凡人都爱讲价值。初次对接的其他部门的同事，也会直接问我，“你对业务的价值是什么” 目前线上线下接触到的同事估计有四五十个，99%交流都顺畅，有话都直说 这一个月约了不少coffee talk，即使没有直接的工作关联，大家还都挺热心解答我各种疑...

阿里云工作强度 513人发布

点赞评论收藏

分享

评论

5

45

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 提名点击就挂的公司 #

4949次浏览 37人参与

# 机械/制造每日一题 #

63142次浏览 990人参与

# 一人说一个值得去的新能源公司 #

10619次浏览 56人参与

# 选择和努力，哪个更重要？ #

96603次浏览 787人参与

# 远程面试的尴尬瞬间 #

160749次浏览 1066人参与

# 大学四年该怎么过，才不算浪费时间？ #

8663次浏览 63人参与

# 落户对你的求职选择影响有多大 #

24008次浏览 90人参与

# 度小满求职进展汇总 #

4487次浏览 33人参与

# 你的国庆怎么过 #

31612次浏览 292人参与

# 25届嵌入式真的回暖了吗 #

39435次浏览 369人参与

# 豪迈求职进展汇总 #

19969次浏览 142人参与

# 双非本科的出路是什么？ #

142194次浏览 1299人参与

# 水滴求职进展汇总 #

9159次浏览 54人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

106607次浏览 735人参与

# 实习学不到东西怎么办？ #

254382次浏览 2473人参与

# HR问：你期望的薪资是多少？如何回答 #

55782次浏览 606人参与

# 大学生该如何认清当下的就业环境？ #

100080次浏览 607人参与

# 辞职之后最想做的一件事 #

24652次浏览 232人参与

# 小厂实习有必要去吗 #

60458次浏览 305人参与

# 毕业论文怎么查AI率 #

58825次浏览 1925人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务