美团大模型算法实习一面

1.项目介绍
2.挨个介绍论文项目,基本上每个都讲了一遍。
3.第一个论文问了,你觉得这个工作后续有没有什么可以改进和拓展的点?这是关于单轮检索的benchmark,我说可以拓展为多轮后续和agent结合在一起。
4.第二个论文的时候问了其中的对比学习的loss,问这个方法可不可以用dpo去做?有没有r的经验?做过哪些实验?mini batch和global batch分别是什么意思?通过什么指标去看grpo训练是否稳定?调参过程中有什么出现的问题嘛?有什么难调的参数?
5.开源项目问了,准备数据的时候如果问题很难模型一个都答不对该怎么做?如果问题很简单,对模型太简单该怎么做?如何得到合理的数据来支撑模型的sft/rl?
6.关于团队:主要偏向业务的模型对齐,验收的指标是在benchmark上测,业务优先,发paper为次但是鼓励做论文。
全部评论

相关推荐

喵喵喵6_6:包大的,也看部门,产品线赶着交付时疯狂加班,预研部门轻松点,124九点,35七点,周六有活就报加班。 氛围得看领导咋样。 但是最烦人的是内部的拉通对齐会随时打断你手上的活,代码写不了一点
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务