快手算法一面

📍面试公司:快手
🕐面试时间:25.08.17
💻面试岗位:算法工程师
❓面试问题:
transformer的架构
encoder和decoder的区别
encoder block有哪些部分组成
attention机制
MHA工程上如何实现
pre norm和post norm的区别
pre norm的优势
Pretrain的损失函数
SFT的损失函数
SFT是如何实现只计算output的损失
RL中reward和 critic 的区别,各自是如何在工程里发挥作用的
RAG中快速索引的优化方法有哪些
用过哪些训练框架,是否有过多机多卡的训练经验
是否遇到训练过程梯度爆炸,显存不足的问题?有哪些解决的trick
手撕算法:伪码实现RAG
🙌面试感想:上来直接问八股,有几个八股没答出来,面试官很年轻会给提醒,也不要求写算法题,直接让手撕个RAG思路。感觉面试官很看重基础和工程能力,没做过的话应该会聊露馅
#发面经攒人品#
全部评论
八股问得细
点赞 回复 分享
发布于 09-10 15:38 北京
base南京,机会多多
点赞 回复 分享
发布于 09-09 19:00 贵州

相关推荐

评论
1
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务