蚂蚁集团内推,蚂蚁集团内推码

算法面经:

📌【一面】基础八股 + RAG深挖

八股:介绍几种Attention(MHA,MQA,GQA)的区别

八股:分别讲一下Dense模型和MoE模型以及二者的区别

八股:讲一下MoE的路由机制是如何做的?

项目:介绍RAG项目,讲一下RAG项目的亮点

项目:如果召回的答案不是想要的,该怎么处理?

项目:讲一下BM25算法原理

项目:是否做过意图识别?如果要做意图识别,可以怎么实现?

项目:微调项目是如何模型选型

项目:如何做微调的?直接用 PEFT 库,还是用LLama Factory做的?

项目:讲一下DPO, PPO, GRPO的原理和区别,写一下DPO loss函数

代码题:lc15 三数之和

🧠【二面】推理加速 + MoE进阶

八股:vLLM中使用的技术是否熟悉(如Paged Attention、KV Cache)?

八股:了解加速推理框架DeepSpeed吗?

八股:MoE模型专家的负载不均衡问题如何解决?

八股:如何通过修改损失函数来解决负载均衡问题?

项目:SFT使用的数据集,使用了多少张卡?SFT训练多久?

项目:SFT 的数据集是越大越好吗?会存在scaling law 吗?

项目:SFT使用的数据可能和原始模型预训练时的数据分布有较大区别,怎么解决?

项目:讲一下LoRA微调的原理,A、B矩阵怎么初始化的,LoRA微调秩设置的是多少

项目:讲一下什么场景下用SFT,什么场景下用RL

项目:为什么使用强化学习会存在训练不稳定问题?为什么业界还在用?

代码题:lc129 求根节点到叶节点数字之和

🎉 蚂蚁集团2026年春季校园招聘启动!🎉

我们正在找像你这样——

爱折腾、有想法、对未来充满期待的你!

不管你是技术控、产品迷、运营小能手,

还是对数据敏感、设计有sense、一心为用户发声的人,

在这里,你都能找到属于自己的战场。

📍 招聘对象:

2027届转正实习:2026年11月-2027年10月海内外院校2026届毕业生

2026届应届补录:2025年11月-2026年10月海内外院校2026届毕业生

🎯 招聘岗位:

技术 | 产品 | 运营 | 数据 | 风险管理 ……

多条成长赛道,总有一条与你的未来契合

📩 内推通道:https://u.alipay.cn/_6a1uuKN7cjcIbR9F8O6n9k

提前锁定筛选资格,距离 Offer 更近一步!大家投递完可以在评论区打上姓名缩写+岗位(比如PM+LJJ),我私你们面经~~

引流:字节跳动,海康威视,深信服,腾讯,阿里巴巴,拼多多,滴滴,京东,小米,大疆,美团,好未来,小红书,华为,简历,offer,面试,面经,三方,国企,央企,秋招,应届生,求职,比亚迪,建设银行,工商银行,百度,中兴,邮储、中行、建行、工行、建行、光大、招商银行、科大讯飞、蔚来、新华三、京东方、容知日新、长鑫存储、阳光电源、中国移动、中国电信、中国联通,中兴,虾皮,网易,腾讯音乐,京东,虎牙,b站,bigo,思科,亚马逊,荣耀,小米,联想,tplink,第四范式,米哈游,携程,旷视,美的,索尼,OPPO,满帮,momenta,欢聚,shein,用友,哈啰,vivo,完美世界,地平线,爱奇艺,汇顶,得物,深睿医疗,全志科技,禾赛,唯品会,度小满,蔚来

#牛友职场人脉来了#
全部评论

相关推荐

不愿透露姓名的神秘牛友
04-10 11:57
1. Guava Cache 和 Caffeine 分别使用了什么缓存淘汰算法​2. 实际项目里本地缓存命中率大概多少​3. 引入缓存带来的风险和解决方案​4. 缓存的读写策略​5. 如何保证缓存和数据库一致性​6. “先写缓存,再异步批量刷库”方案,除一致性外还有哪些潜在风险​7. 如何拦截恶意请求,设计防护手段避免缓存被恶意利用​8. 布隆过滤器原理,如何解决缓存穿透​9. 布隆过滤器误判概率大概多少,如何估计​10. 定时任务 5 分钟一轮询,任务执行超 5 分钟时,如何保证状态不丢失、不阻塞调度​11. 分布式 RPC 为什么要自定义协议,而不用 HTTP​12. 单机 QPS 1w+ 这个数据是怎么统计/得到的​13. RPC 项目目前瓶颈在哪​14. 了解哪些 HTTP 版本,各版本特性​15. HTTP 队头阻塞是什么​16. 队头阻塞是否只存在于 HTTP 层面​17. TCP 会不会存在对应阻塞问题​18. HTTP3 如何解决 HTTP2 在 TCP 上的队头阻塞​19. 为什么 HTTP3 基于 QUIC,而不继续在 TCP 上优化​20. TCP 如何实现可靠传输和流量控制​21. TCP 发送窗口如何根据接收窗口和拥塞情况动态调整,窗口结构如何维护变化​22. TCP 如何判断报文丢失,什么条件触发重传​23. TCP 除重传计时器外还有哪些计时器​24. AI 项目中降低大模型幻觉的具体优化方法​25. 大模型产生幻觉的底层技术原因​26. 算法题:Java 原生数组实现栈,实现常用操作
查看26道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务