字节豆包算法岗面经

✅一面
1.自我介绍,问实习和论文
2.看你实习微调过Qwen2,说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构,相比于 Encoder - Decoder 的架构好在哪里
4.讲一下 RoPE 吧,目前常用的位置编码还有哪些, RoPE 有什么优点(相对位置、外推性……),如何进一步外推
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么, DPO 相比 PPO 的 RLHF 做了哪些改进,除此之外还知道哪些 RL 算法,知道 DeepSeek 的 GRPO 吗
7.代码:23.合并 K 个升序链表
一面整体来说还是比较基础的,都是一些八股的知识,没有考什么自由发挥的题。不过力扣还是难的,出了一道 hard
✅二面
1.自我介绍,选一个做的好的实习或者论文讲一下,这里问的比较细,动机是什么,为什么用当前的方案
2.了解 KV cache 吗, GQA 的思想是什么
3.讲一下 FlashAttention 的思想和做法
4.除了刚刚说到的这些,还了解过哪些模型训练推理优化的方法( DeepSpeed ,数据并行,张量并行,流水线并行……
5.开放题:如果要提升大模型的多轮对话能力,你有哪些可以改进的点
6.代码:刚刚提到了 GQA ,写一下 GQA 吧
二面更偏底层优化,没有过多的问一些大模型结构方面的东西,应该是考虑到一面都问过了。整体的考察比较灵活一些
✅三面:
1.自我介绍,过实习和论文,这里面试官会穿插问一些八股的知识,比如了解 Qwen 的结构吗,微调的数据配比是怎样的
2.大模型的灾难性遗忘问题怎么解决
3.了解 RAG 吗, GraphRAG 的做法
4.场景题:目前有一些专业领域知识,比如医疗知识或者法律条文,准备做一个智能助手,要让你搭建一个 RAG 链路,会怎么做
5.开放题:用过豆包吗,觉得目前豆包还存在什么问题
6.代码:416.分割等和子集
三面一些八股还是问的比较常规的,但是自由发挥的题目有点多,感觉有点难答,不过好在面试官会进行启发,抛出一些小问题来引导回答
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

08-30 10:20
已编辑
门头沟学院
省流总结: 招聘全栈工程师,不像互联网,没有平台,需要从底层原理聊起,完成ETL的相关任务。全程一问三不知,给面试官说用大数据组件的原理来解决问题,面试官说你具体说你会写什么技术器。1. 自我介绍2. dqc怎么配的?3. sla怎么配的?4. mysql发生数据的增删改的时候,你怎么同步?5. 你说用Flink cdc完成了数据同步,你讲讲具体怎么操作?6. 了不了解redis?7. redis为什么快8. redis的底层结构是什么?9. mysql的事务了解吗?10. 索引了解吗?有哪些索引?11. 前缀索引是怎么匹配的?12. 前缀索引的底层原理是什么?13. 前缀索引的数据结构是什么?14. 死锁了解吗? 什么条件会导致死锁?15. 日常用的什么语言比较多? 我答python和sql16. python多线程和多进程了解吗?17. 用python读过大数据量的表吗?18. 给一个分布式的多个机器,要同时访问/修改某个文件,你说说怎么解决?19. numpy怎么读大数据量的表20. 做过通知机器人吗?21. 智力题?硬币翻转 我说递归去做,面试官说你这只是提出了个方法,没给答案。22. 快排了解吗?说一下原理无手撕反问:1. 业务主要做什么2. 希望候选人具有什么样的品质3. 工作强度大不大被嫌弃了都是基于平台做的,说我不懂计算机的基础,这对于转专业数开鼠鼠来说,太难了....
查看25道真题和解析
点赞 评论 收藏
分享
评论
5
32
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务