快手直播推荐算法日常实习一面
code模式:要求写一下核心代码,不要求运行
1.合并有序数组(双指针)
2.搜索插入位置(二分)
1.介绍一下实习过程的整个推荐的链路设置
2.分析一下din的attention和transformer的注意力机制有什么不同,如果要引入transfomer的注意力机制,你会怎么做?
3.在线推理的时延是多少,有没有办法减低时延?
4.实习的模型更新的时期是按天为单位还是按小时为单位?如果线上用户点击产生了一条正样本,模型如何做出反应来学习这个行为?
5.ESMM模型后面的论文了不了解?
6.介绍一下ESM^2,有没有读过原论文?深挖
7.DeepFM的FM侧是如何计算的?时间复杂度是多少?现场推导一下数学公式
8.哪些特征会来拿做embedding?id类特征会拿来做embedding吗?你觉得是日活千万会产生硬编码吗?为什么?
9.dense类的特征可以拿来做embedding吗?怎么做?你觉得这个效果是语义空间产生的还是参数量产生的?分桶怎么做?
10.解释一下梯度消失?处理策略?
11.手撕一下多头注意力,询问其变体和设计的思路,以及添加策略
1.合并有序数组(双指针)
2.搜索插入位置(二分)
1.介绍一下实习过程的整个推荐的链路设置
2.分析一下din的attention和transformer的注意力机制有什么不同,如果要引入transfomer的注意力机制,你会怎么做?
3.在线推理的时延是多少,有没有办法减低时延?
4.实习的模型更新的时期是按天为单位还是按小时为单位?如果线上用户点击产生了一条正样本,模型如何做出反应来学习这个行为?
5.ESMM模型后面的论文了不了解?
6.介绍一下ESM^2,有没有读过原论文?深挖
7.DeepFM的FM侧是如何计算的?时间复杂度是多少?现场推导一下数学公式
8.哪些特征会来拿做embedding?id类特征会拿来做embedding吗?你觉得是日活千万会产生硬编码吗?为什么?
9.dense类的特征可以拿来做embedding吗?怎么做?你觉得这个效果是语义空间产生的还是参数量产生的?分桶怎么做?
10.解释一下梯度消失?处理策略?
11.手撕一下多头注意力,询问其变体和设计的思路,以及添加策略
全部评论
相关推荐
查看4道真题和解析