腾讯推荐算法一面

1. 广告业务场景题:

a. 在广告排序时,我们既要考虑点击率(pCTR),也要考虑转化率(pCVR)。如果让你来设计线上排序的融合公式,你会简单地把它们加权相加,还是用 `pCTR * pCVR` 这种形式?这两种方式各有什么优缺点?

b. 训练一个同时预测点击和转化的多任务模型时,如果直接把两个任务的loss加起来,模型可能会只学好简单的点击任务,而忽略了转化任务。你会用什么方法来平衡这两个loss,让模型“雨露均沾”?

c. 像MMoE这样的多任务模型,号称能解决任务冲突的问题。你能用大白话解释一下,它是怎么用所谓的“专家网络”来做到这一点的吗?

d. 有时我们优化模型后,发现高热度内容的推荐效果变好了,但长尾内容的效果却变差了,这就是“跷跷板问题”。你觉得导致这个问题的原因是什么?有什么办法可以缓解它吗?

2. 模型基础知识:

a. Batch Normalization (BN) 和 Layer Normalization (LN) 都是归一化方法,我们应该怎么选?比如在做图片处理的CNN和处理文本的Transformer里,通常会分别用哪个?为什么?

b. BN在训练和测试时的行为为什么不一样?它在训练时计算的那些均值和方差,到测试的时候是怎么用的?

c. Adam是现在最常用的优化器之一。它为什么比传统的SGD要好用?它在调整学习率的时候,综合了哪两种思想?

d. AUC是衡量分类模型好坏的常用指标。你能直观地解释一下AUC值代表了什么吗?如果我们现在做的是一个回归任务(比如预测视频的播放时长),还能用AUC来评估模型的排序好坏吗?如果可以,要怎么做?

3. 核心代码模式算法题:二叉树的中序遍历

全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务