需要的uu自取~

相关推荐

面试官蛮好的针对实习项目的一些场景进行拓展提问,总体上来讲比较深入,但是也会耐心的引导回答,面了75min无手撕实习:架构介绍,我这里画了一张架构图,针对着讲了下项目的需求,以及如何发展的,怎么性能优化面试官问了消息队列的取舍(为什么用的Rabbit不用Kafka),RabbitMQ及时性为啥比Kafka强底层是怎么样的,推拉分别是啥,另外就是发送数据的去重是如何实现的,(项目了没有实现说了下方法,但是出现了大key问题,又换了个数据结构set,面试官觉得还可以)八股拷打:1.分布式环境资源抢占,如何解决2.分布式锁如何实现,Redis MySQL ZK 我这臭嘴就不该提ZK的,追问ZK底层实现(不会)3.用过Map嘛,怎么用的,底层是如何实现的,什么结构,不同版本之间的差别,如何保证并发安全,为什么1.7有环链,为什么2的n次方容量,扩容位置变化4.线程创建方式,线程池参数,工作流程,拒绝策略5.场景题:订单超时未支付处理无手撕,问了问算法刷的怎么样,说别到给我推到了第二轮挂算法上反问:面试官面试官这样的面试后续还会有几轮呀,答:有的xd有的这样的技术面还有两轮,建议给我转到秋招流程去,感觉滴滴的实习短的一轮就过了,为啥到我这三轮啊哭死了😭明天还有美团实习的面试,希望顺利吧
查看10道真题和解析
点赞 评论 收藏
分享
1.  注意力机制:请简述 MHA、MQA 和 GQA 三种注意力机制的核心区别。2.  模型架构:Dense 模型与 MoE 模型有何本质区别?3.  路由机制:MoE 模型中,路由(Routing)机制具体是如何工作的?4.  LoRA 微调:请阐述 LoRA 的原理,以及其中 A、B 矩阵的初始化方式和秩(Rank)的设置考量。5.  强化学习:请对比 DPO、PPO 和 GRPO 的原理与区别,并写出 DPO 的 Loss 函数公式。6.  推理加速:vLLM 中使用了哪些关键技术(如 PagedAttention、KV Cache)来优化推理?7.  并行框架:你对 DeepSpeed 这一加速推理与训练框架有多少了解?8.  BM25 算法:请讲解 BM25 算法的计算原理。9.  负载均衡:MoE 模型中专家(Expert)的负载不均衡问题该如何解决?10.  损失函数:能否通过修改损失函数的方式来缓解 MoE 的负载均衡问题?11.  数据分布:SFT 微调数据与预训练数据分布差异较大时,该如何处理?12. Scaling Law:SFT 微调的数据集是越大越好吗?是否存在 Scaling Law 现象?13. 训练稳定性:强化学习(RL)为何存在训练不稳定的问题?既然不稳定为何业界仍广泛使用?14. 三数之和:LeetCode 15. 三数之和。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看14道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务