微信wxg大模型算法实习一面 夯中夯
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.为什么强化学习用的是Grpo,没有用DPo测试?如果要改进的话有什么想法?
3.有没有遇到上线后过拟合的情况?
4.蒸馏部署的合规率怎么算的,离线的吗?
5.在推荐场景下,有了sid之后怎么构造样本,然后以及怎么去训练。推荐系统和大模型结合,能基于目前的东西做什么改进?
两个力扣:
1.数组top k
2.数组中出现两次的数
1.项目拷打
2.为什么强化学习用的是Grpo,没有用DPo测试?如果要改进的话有什么想法?
3.有没有遇到上线后过拟合的情况?
4.蒸馏部署的合规率怎么算的,离线的吗?
5.在推荐场景下,有了sid之后怎么构造样本,然后以及怎么去训练。推荐系统和大模型结合,能基于目前的东西做什么改进?
两个力扣:
1.数组top k
2.数组中出现两次的数
全部评论
相关推荐
点赞 评论 收藏
分享
查看7道真题和解析