26届校招|腾讯搜索算法三面

1.了解deepseek - R1吗,介绍一下
2.大模型灾难性遗忘是什么?怎么解决的?
3.gbdt怎么实现并行化的?
 4.deepspeed三个阶段。
5. 多路检索如何实现?如何合并多路检索的结果,对它们做排序?
6.什么是旋转位置编码,解决了什么问题,为什么
7.训练一个7b模型要占用多少显存,不同zero阶段能节省多少显存
8. Embedding 与生成模型协同工作是怎么做的?
9.讲DPO、PPO、RLHF。
10.为什么在参数高效微调中使用低秩矩阵分解?
11.数组中目标出现的开始和结束位置,二分秒了。
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务