✅一面 1.自我介绍2.项目拷打与反问3.写一下交叉熵损失的公式4.MSE能用到分类任务上吗5.介绍transformer6.介绍auc,精确度,召回率,F1等等,auc的意义是什么7.为什么Transformer用ln不用bn8.开放:如果给你一批数据的点击率,曝光度,位置信息等,如何判断用户点击数据是否跟数据的位置有关✅二面1.项目的拷打与反问,比一面要刁钻一些2.问了GRPO和DPO的公式,后者没答出来3.问了DRPO,为什么可以把散度去掉,没答上来4.为什么要重要性采样5.讲一下注意力机制,交叉注意力,为什么除以根号d6.介绍一下什么情况下会出现梯度爆炸和梯度消失,为什么,出现了这种情况模型会怎么样7.贪心算法📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。