腾讯实习-大模型算法二面面经分享

感觉自己好菜、面试很难,还是要多多练习
1.拷打项目
2.介绍一下grpo训练流程 ppo loss公式 新的网络概率比老的概率要大很多且此时样本优势是负的 会被clip掉需要学习吗
3.benchmark有模型在上面刷榜吗 有没有考虑这种关联推理能力难度太大 现在的研究暂时不需要关注这个能力
4.平时怎么用vibe coding cursor怎么设计的 怎么记住你之前编码踩过的坑
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务