虾皮推荐算法实习一面
攒人品中,祝大家都能拿到满意的Offer!
1.项目拷打
2. grpo 和 dpo 以及跟最早的 ppo 有什么区别,这个你有了解吗?
3.在做大模训练时,一般用全参数微调还是 lora 微调?简单描述下 lora 的原理。
4.训练的优化器一般用什么? Adam 跟 SGD 的显存相比哪个占比更高?
5.对搜推有了解吗,比如精排、召回的模型?除了 FM 和 DeepFM 这种做特征交叉的结构,还有哪些其他的做特征交叉的结构吗? DCN 了解吗?
6.精排和召回的区别在哪,或者说为什么一般先做召回再去做精排?
7.代码题: leetcode hot 100的题
1.项目拷打
2. grpo 和 dpo 以及跟最早的 ppo 有什么区别,这个你有了解吗?
3.在做大模训练时,一般用全参数微调还是 lora 微调?简单描述下 lora 的原理。
4.训练的优化器一般用什么? Adam 跟 SGD 的显存相比哪个占比更高?
5.对搜推有了解吗,比如精排、召回的模型?除了 FM 和 DeepFM 这种做特征交叉的结构,还有哪些其他的做特征交叉的结构吗? DCN 了解吗?
6.精排和召回的区别在哪,或者说为什么一般先做召回再去做精排?
7.代码题: leetcode hot 100的题
全部评论
相关推荐
查看13道真题和解析