首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
不要摇我可乐
2020-08-06 17:03
已编辑
湖南大学 算法工程师
关注
已关注
取消关注
关于推荐算法的一些疑问?
想问一些有面试经历的大佬们:
现在 (推荐算法+强化学习) 是不是很热门,好像近两年各大公司都有将RL应用在推荐系统中,包括一些游戏公司。而且我看了很多面经,发现RL方面的问题也确实不少。
RL在推荐系统中的应用是未来几年的风向么?RL是否已经成为推荐算法工程师的必备技能?
求大佬解惑~
提示
全部评论
推荐
最新
楼层
ToLovo
门头沟学院 算法工程师
认识一个阿里实习的大佬 据说RL推荐在线上已经有不错的应用了 结合监督的方式。 RL算是一个未来发展方向,必备不至于,但是如果你想进BAT这种,还是需要了解一下前沿研究的。
点赞
回复
分享
发布于 2020-08-06 20:45
ullllll
北京舞蹈学院 Java
m
点赞
回复
分享
发布于 2020-08-06 17:14
暂无评论,快来抢首评~
相关推荐
03-05 20:16
已编辑
南京邮电大学 算法工程师
某ai小厂算法面经(已oc)
自我感觉答的不好,语言组织能力差,但面试官说还可以项目拷打+八股1.BM25是怎么设计的2.讲讲Lora3.整个训练花了多长时间4.数据集怎么构建的?5.了解强化学习吗?6.rag问答的整个流程是怎么样的7.讲讲训练的损失函数有哪些反问1.我表现如何2.公司主营业务和落地产品3.公司人事架构4.是否有成熟的技术文档刚面完就oc,体验感很好,不过200人的ai公司算小厂吗?
点赞
评论
收藏
分享
03-13 21:45
门头沟学院 机器学习
字节实习 机器学习 面经 1h
被横向挂了,希望发出来对大家有帮助!1.拷打项目2.对强化学习训练有什么了解吗?3.如果有一个对话任务,没有固定答案,该怎么选RL训练策略4.讲一讲GRPO的原理,优劣以及后续改进5.预训练和SFT的loss计算差异?6.Qwen3相比前代有什么改进?7.目前LLM领域关注到哪些最新进展?8.手撕:最长公共子序列
查看8道真题和解析
点赞
评论
收藏
分享
03-19 16:15
门头沟学院 推荐算法
美团也爱问AI
搜推+大模型算法一面面试题SFT & RL 方向先 answer 后 cot vs 先 cot 后 answer:两种 SFT 范式在训练效果上有什么差异?你是否做过对比实验?标注质量管控:如何保证人工标注数据的准确率达到预期标准?有哪些校验或质控手段?Checkpoint 选择:如何挑选合适的 SFT checkpoint,用于后续的 RLHF 阶段?多模态输入:图片是如何输入到 VLM 模型中的?一张图片通常会被编码为多少个 token?RL vs SFT:你认为强化学习(RL)和监督微调(SFT)的核心区别是什么?训练范式选择:为什么不直接从零开始做 RL,而是要采用「SFT → RL」的两阶段流程?RL 关键机制:什么是重要性采样?为什么在 RL 训练中要引入 CLIP 机制?策略类型差异:On-policy 和 Off-policy 算法的核心区别是什么?各自的适用场景有哪些?八股文(Transformer 基础)因果掩码作用:Transformer Decoder 中为什么必须使用自回归因果掩码?缩放点积注意力:为什么注意力分数要除以dk?(补充:Layernorm 前置后,除以d可将方差归一到 1,避免 softmax 梯度饱和)推荐系统方向生成式推荐 vs 传统推荐:两者的核心区别是什么?生成式推荐的目标是什么?你如何看待它的未来发展前景?指标计算:AUC、HR、NDCG 的计算公式分别是什么?GAUC 和 AUC 的区别在哪里?编码方式:如何在模型中加入时间编码和位置编码?常用的位置编码方法有哪些?Coding:手撕 Multi-Head Attention(MHA) 实现二面面试题SFT & CoT 细节概率分布特性:在「先 cot 后 answer」的 SFT 范式下,为什么越靠后的 token 概率(prob)会越高?蒸馏噪声处理:用大模型蒸馏得到的 CoT 数据存在大量噪声,该如何缓解?VLM 幻觉问题:对 VLM 做 SFT 时,发现模型更信任文本信息,看图时反而容易产生幻觉,有哪些解决思路?RL 进阶PPO 核心:写出 PPO 中 GAE 的公式,并说明如何递归计算每个 token 的优势函数(advantage)?DPO 损失:写出 DPO 算法的损失函数公式?算法对比:GRPO 和 PPO 的核心区别是什么?GSPO 和 GRPO 又有哪些不同?训练稳定性:你遇到过 RL 中的熵塌缩(entropy collapse)和 reward hacking 问题吗?分别有哪些改进方法?最近有哪些新论文提出了新方案?采样困境:在采样类 RL 算法中,on-policy rollout 无法得到正确答案时该怎么办?自蒸馏:了解 Self-Distillation 吗?为什么要做自蒸馏?最近这方向有哪些代表性论文?震荡优化:RL 训练中 reward 或 loss 震荡严重,该如何调整?(提示:可从学习率 lr、KL 散度约束等方向入手)推荐系统进阶结构对比:HSTU 和 Transformer 结构的差异是什么?它和 OneRec 的整体流程有什么不同?SID 优化:如何降低 SID 碰撞率,同时提高特征利用率?量化算法:RQ-VAE 和 RQ-Kmeans 的算法原理分别是什么?OneRec 工程:OneRec 中是如何将 SID 加入模型词表和 tokenizer 的?多模态融合:如何更好地结合文本特征和多模态特征?模型演进:Rankmixer 是如何发展到 Tokenmixer 的?Coding:给定一个行内严格递增的 m×n 矩阵,找到矩阵中第 k 大的数
面试官最爱问的 AI 问...
点赞
评论
收藏
分享
03-23 18:20
门头沟学院 推荐算法
字节实习 推荐算法 一面 55min
继续来分享下之前的面经~欢迎友好讨论,信息共享1. 项目拷打2. 实习拷打3. 问了多任务模型,mmoe,ple都分别介绍下,各自做了哪些优化,有什么作用4. 广告系统和推荐系统的异同点5. 投放链路:召回粗排精排重排流程以及常见算法6. 分类和回归任务的关系,可否相互转化?7. DIN模型介绍下8. 常见的损失函数有哪些9. 简单问了auc的计算和理解10. 手撕代码:给n对括号,输出所有排
查看8道真题和解析
点赞
评论
收藏
分享
03-09 02:40
南华大学 产品经理
AI 产品实习面经(美团
发一下问题给大家参考,攒攒人品!1.实习拷打2. 美团“零售+科技”战略下,AI产品经理应该先做C端还是先做B端?为什么?3. 如何判断一个AI需求是“真需求”还是“伪需求”?4. 如果外卖配送ETA(预估送达时间)的AI模型准确率从90%提升到95%,对业务的价值如何量化?5. 你用过美团小象超市吗?如果你是产品经理,怎么用AI优化生鲜的库存周转?6. 请拆解一下推荐算法在美团APP首页的信息流里是怎么工作的。7. 当算法工程师说“这个特征加进去收益不明显”,你怎么说服他继续尝试?8. 你如何看待大模型在本地生活服务领域的落地机会?哪个场景最先爆发?
查看7道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
1
1
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
双非春秋招3月总结与收获
6098
2
...
4.2字节后端一面
4278
3
...
美团暑期二面,横向挂
4048
4
...
恒生电子笔试已燃尽
3672
5
...
26年最值得冲的产品项目是什么?一个过来人的大实话
3024
6
...
2026 产品岗春招|这种「稀缺管培生」该怎么准备?
2974
7
...
银行老学长带来点春招信息差
2751
8
...
恒生电子笔试
2651
9
...
28届双非本腾讯开发实习oc
1824
10
...
快手后端oc
1534
创作者周榜
更多
正在热议
更多
#
你的实习产出是真实的还是包装的?
#
35327次浏览
433人参与
#
网申一定要掌握的小技巧
#
20336次浏览
83人参与
#
厦门银行科技岗值不值得投
#
15723次浏览
359人参与
#
uu们,春招你还来吗?
#
63317次浏览
745人参与
#
学历VS实习,哪个更重要?
#
1872次浏览
52人参与
#
一人一道大厂面试题
#
124875次浏览
1301人参与
#
面试中,你被问过哪些奇葩问题?
#
96318次浏览
1271人参与
#
面试被问到不会的问题,你怎么应对?
#
26008次浏览
657人参与
#
你都用vibe coding做过什么?
#
22022次浏览
820人参与
#
你觉得大几开始实习最合适?
#
30175次浏览
313人参与
#
你见过哪些招聘隐形歧视?
#
25052次浏览
214人参与
#
AI Coding实战技巧
#
15462次浏览
299人参与
#
哔哩哔哩笔试
#
35150次浏览
142人参与
#
面试紧张时你会有什么表现?
#
34109次浏览
210人参与
#
如果人生可以debug你会改哪一行?
#
13048次浏览
167人参与
#
你现在一天AI几次?
#
13465次浏览
137人参与
#
机械人,签完三方你在忙什么?
#
83935次浏览
266人参与
#
Claude Code泄露源码
#
15735次浏览
212人参与
#
做完笔试后你收到面试了吗?
#
26176次浏览
231人参与
#
机械人你觉得今年行情怎么样?
#
7888次浏览
96人参与
#
工作上你捅过哪些篓子?
#
68337次浏览
315人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务