大模型算法面经分享-字节
整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1.深挖论文
2.讲一下multi-head attention 用pytorch手撕一下 要可以实现cross attention的
3.讲一下你用的大模型是什么结构 特征是怎么喂给大模型的
4.大模型训练为什么不用SFT
5.LoRA是什么?有什么好处
6.知道RLHF吗?讲一下训练流程
7.接下来就是好几个场景题
1.深挖论文
2.讲一下multi-head attention 用pytorch手撕一下 要可以实现cross attention的
3.讲一下你用的大模型是什么结构 特征是怎么喂给大模型的
4.大模型训练为什么不用SFT
5.LoRA是什么?有什么好处
6.知道RLHF吗?讲一下训练流程
7.接下来就是好几个场景题
全部评论
相关推荐
查看4道真题和解析 点赞 评论 收藏
分享
