B站大模型一面
📍面试公司:B站
💻面试岗位:大模型
❓面试问题:
手撕多头注意力机制,然后问了为什么除以dk,除了注意力,transformer还有什么,batch norm和layer norm的区别,非线性是谁提供的
对比学习的loss
聊了很久的论文,具体都有什么场景
dpo和ppo的区别,包括理论上,还有项目实际落地
闲聊+反问
🙌面试感想:体验良好,整体氛围很轻松#大模型##大模型面经##大模型算法工程师##B站校招#
#面试问题记录#
💻面试岗位:大模型
❓面试问题:
手撕多头注意力机制,然后问了为什么除以dk,除了注意力,transformer还有什么,batch norm和layer norm的区别,非线性是谁提供的
对比学习的loss
聊了很久的论文,具体都有什么场景
dpo和ppo的区别,包括理论上,还有项目实际落地
闲聊+反问
🙌面试感想:体验良好,整体氛围很轻松#大模型##大模型面经##大模型算法工程师##B站校招#
#面试问题记录#
全部评论
相关推荐
点赞 评论 收藏
分享