日常实习字节多模态大模型算法二面

攒人品中,有面试过同岗的朋友欢迎评论区交流
1.llava1.6的改进
2.qwen23vl的改进
3.手撕MHA
4.DPO与PPO的区别
5.GRPO如何计算相对R
6.GRPO为什么要对重要性ratio进行clip
7.为什么要除以根号Dk
8.为什么注意力操作是qkv三个向量
9.一般通过什么方式进行知识的学习
10.看过什么技术报告
全部评论
手撕MHA细节?
点赞 回复 分享
发布于 03-15 18:41 北京
佬面的是哪个部门呀
点赞 回复 分享
发布于 02-11 01:43 湖北

相关推荐

点赞 评论 收藏
分享
讲原则的小黄鸭不愿吃...:有时候面试眼缘确实很重要,当然,飞驰人生2中张弛说的很对:我努力了无数次,但是我知道机会只会出现在其中一两次。你把每一次笔试面试都全力以赴,总有你运气发挥到位的时候
点赞 评论 收藏
分享
评论
1
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务