微信wxg大模型算法实习一面 夯中夯

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.为什么强化学习用的是Grpo,没有用DPo测试?如果要改进的话有什么想法?
3.有没有遇到上线后过拟合的情况?
4.蒸馏部署的合规率怎么算的,离线的吗?
5.在推荐场景下,有了sid之后怎么构造样本,然后以及怎么去训练。推荐系统和大模型结合,能基于目前的东西做什么改进?

两个力扣:
1.数组top k
2.数组中出现两次的数
全部评论

相关推荐

04-08 23:37
已编辑
东华大学 结构工程师
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务