被横向挂了,希望发出来对大家有帮助!Q1: 你用了多路召回,具体是怎么做消融实验验证每一路的效果的?Q2: 召回层的评估指标为什么选 HitRate 而不是其他?Q3: 新闻推荐项目里的“冷启动”是怎么做的?Q4: 详细讲讲 YouTube DNN 双塔模型在你的项目里是怎么落地的?Q5: 用户的 Embedding 是怎么构建出来的?输入了哪些具体特征?Q6: 提取出 User Embedding 和 Item Embedding 之后,你后续具体是怎么利用它们的?Q7: 精排阶段,你为什么要把“树的排序模型”、“树的分类模型”和“DIN 模型”做 Stacking 融合?它们在理论上的互补性体现在哪?Q8: 手写 AUC 的计算公式。Q9: 工业界为什么更偏爱 GAUC 而不是全局 AUC?GAUC 解决了什么痛点?Q10: 训练的时候,交叉熵 Loss 下降,AUC 就一定会提升吗?Q11: 你提到的这几个模型,它们底层的 Loss 函数分别是什么?