字节 一二三面
一面:讲一下论文。深挖了一下项目。讲一下强化学习。代码题不是leetcode,完整做出来了。
二面:讲一下论文。grpo和ppo的区别。大模型训练流程。拒绝采样数据处理怎么回事的。问了一下对自己的期待和未来职业规划。问了我的优点和缺点。没有编程题。
三面:讲一篇自己的论文。介绍项目。问了微调大模型如何卡阈值。为什么CLIP的嵌入效果不好?有什么解决办法。手撕了infonce代码。
许愿hr面。
二面:讲一下论文。grpo和ppo的区别。大模型训练流程。拒绝采样数据处理怎么回事的。问了一下对自己的期待和未来职业规划。问了我的优点和缺点。没有编程题。
三面:讲一篇自己的论文。介绍项目。问了微调大模型如何卡阈值。为什么CLIP的嵌入效果不好?有什么解决办法。手撕了infonce代码。
许愿hr面。
全部评论
相关推荐
查看12道真题和解析 点赞 评论 收藏
分享