27日常实习虾皮多模态算法一面
感觉自己好菜、面试很难,还是要多多练习
1.项目拷打
2. CLIP 的 ViT 为什么必须 resize 固定尺寸?用动态的不行吗?
3. PPO 是怎么训练的?有哪些模块?
4.DPO 和 PPO 的区别呢?
5. DPO 相比于 PPO 有哪些模型?
6.GRPO 是怎么做的?
7. DPO 没有 Reward Model 为什么也能做偏好优化呢?
8.GRPO 的优势是什么?
9.Transformer 里常见的位置编码有哪些?
10. 绝对位置编码是怎么做的?
11. 绝对位置编码相比于旋转位置编码(ROPE)的缺点是什么?除了外推性还有别的吗?
12. 旋转位置编码(ROPE)是怎么做到相对距离的位置编码的?它的旋转是怎么做的?
13. RMS Norm 跟 Layer Norm 的区别是什么?
14. 为什么 RMS Norm 不用强制居中也能有比较好的效果?
15.手撕 pow
1.项目拷打
2. CLIP 的 ViT 为什么必须 resize 固定尺寸?用动态的不行吗?
3. PPO 是怎么训练的?有哪些模块?
4.DPO 和 PPO 的区别呢?
5. DPO 相比于 PPO 有哪些模型?
6.GRPO 是怎么做的?
7. DPO 没有 Reward Model 为什么也能做偏好优化呢?
8.GRPO 的优势是什么?
9.Transformer 里常见的位置编码有哪些?
10. 绝对位置编码是怎么做的?
11. 绝对位置编码相比于旋转位置编码(ROPE)的缺点是什么?除了外推性还有别的吗?
12. 旋转位置编码(ROPE)是怎么做到相对距离的位置编码的?它的旋转是怎么做的?
13. RMS Norm 跟 Layer Norm 的区别是什么?
14. 为什么 RMS Norm 不用强制居中也能有比较好的效果?
15.手撕 pow
全部评论
拼多多招27届实习生啦 https://careers.pddglobalhr.com/campus/intern/detail?t=dRvUVvcTiA
相关推荐
查看9道真题和解析