继续来分享下之前的面经~欢迎友好讨论,信息共享1. MAP(最大后验概率)和似然函数有什么关系?2. 什么情况下,MAP的损失函数可以用NMSE来计算?(高斯噪声)3. 手写Multi-head Attention4. Attention的复杂度是多少?5. AUC是什么?6. 推荐算法了解哪些?7. 协同过滤的概念是什么?8. 如果是一种普适性很强的物品(如:新华字典),怎么设计指标对它降权?9. AUC怎么推广到非二分类问题?怎么快速计算AUC?10. bn训练阶段和测试阶段区别,详细讲讲原理11. dropout原理,训练阶段和测试阶段区别,为什么12. deepwalk和node2vec原理13. 协同过滤讲讲原理14. 推荐多任务模型了解哪些,讲一下esmm15. 手撕交叉熵,二叉树最近祖先