腾讯大模型算法 日常实习 一面
发一下问题给大家参考,攒攒人品!
1.项目拷打
2. Qwen和DeepSeek的技术差异。
3.当前主流的强化学习算法有哪些?请写出对应损失函数的数学表达式。
4.介绍RLHF的实施流程。
5. RLHF对齐流程解析。
6.说明 SFT (监督微调)和 RLHF (基于人类反馈的强化学习)的具体作用。
7. LORA (低秩自适应)的核心原理。
8.使用 SFT 存在哪些局限性。
9.手撕实现"括号生成"问题( LeetCode 22),要求生成 n 对有效括号的所有组合。
1.项目拷打
2. Qwen和DeepSeek的技术差异。
3.当前主流的强化学习算法有哪些?请写出对应损失函数的数学表达式。
4.介绍RLHF的实施流程。
5. RLHF对齐流程解析。
6.说明 SFT (监督微调)和 RLHF (基于人类反馈的强化学习)的具体作用。
7. LORA (低秩自适应)的核心原理。
8.使用 SFT 存在哪些局限性。
9.手撕实现"括号生成"问题( LeetCode 22),要求生成 n 对有效括号的所有组合。
全部评论
相关推荐
不管什么都不想跳动了:本人美团百度快手都待过,建议肯定是直接留快手多一点产出后转正or直接冲字节腾讯暑期吧。一是快手从福利到基建都吊打另外两家。美团现在这个业务比较惨,本来毛利就很低,亏损严重,今年很可能要优化人力降低成本,去了别说日常,就算暑期后面都很可能被优化。百度其实实习生权限挺高的,可以接触到一些含金量高的项目,但是现在的风评不如之前了,薪资也不高。二是转正概率和薪资是跟产出挂钩的,你都在手子已经积累产出了,去其他家日常实习产出都是从0开始,肯定不可能有你在手子转正可能性大啊,现在日常压根没必要去,而且我有两个师弟都是在快手日常转正的,不用太担心,安心留在手子一边多做一点产出然后一边冲字节腾讯暑期,字节腾讯今年实习岗位非常多的,不如好好把握这个,加油。
点赞 评论 收藏
分享
昨天 21:00
蚌埠坦克学院 嵌入式软件开发 今年的金三银四感觉有点淡,岗位数量没有想象中那么多,很多公司也变得更谨慎了。投出去的简历不少,但面试机会并不算多。就业环境确实比以前紧张一些,不过也不用太焦虑,慢慢准备、持续投递,总会遇到合适的机会。
点赞 评论 收藏
分享