百度-文心一言-一面面经

情况:面完一面过了一周,HR直接发了OFFER,没有二面,已oc

  1. PPO与GRPO的区别,分别介绍他们的优势与缺点
  2. DPO对齐训练的曲线是怎么样的,正例的概率会提升嘛,参考这个知乎回答:
  3. Deepseek-R1里面不仅推理能力很好,而且文采能力也很好,这个是个开放问题,如何让模型的文采能力也很好呢?
  4. 介绍你在实习做的事情,有遇到什么case嘛,怎么解决的
  5. deepseed介绍
  6. deepspeed的每一段的通信比较,zero3分别是0和2的多少倍,1.5倍
  7. DPO如何解决回答过长的问题,除了正则
  8. 开放问题:为什么现在大家都在关注于大模型的推理能力reasoning
  9. 对于一个base model如何增强大模型的reasoning能力
  10. DPO除了长度问题还有其他的问题嘛,与问题2对应,reward hacking?都没有奖励模型了
  11. 说一下simpo的原理,它是怎么解决dpo微调序列过长的问题的

反问:

1、到了那边具体做什么呢能发论文嘛?

主要是研究怎么提升基座模型的能力,用RL或者其他方法提升基本能力,论文不带着发但是能自己发。

2、有多少资源可以用?

大概有几百张A100资源,用了实习生举例子,这个实习生训练用了48卡A100训练。

#强化学习##算法##文心一言##百度##技术岗笔试题求解#
全部评论
感觉这个还可以啊,文心一言title挺大的吧。博主最后还是没去吗我最近也在犹豫去不去
点赞 回复 分享
发布于 05-01 15:52 江苏
让我再发一个面经!
点赞 回复 分享
发布于 03-20 17:03 浙江
接好运
点赞 回复 分享
发布于 03-18 12:24 重庆
接好运
点赞 回复 分享
发布于 03-18 11:38 山东
请问是日常还是暑期啊?
点赞 回复 分享
发布于 03-17 01:41 浙江
面经可以分享吗
点赞 回复 分享
发布于 03-16 22:35 陕西
是日常实习吗
点赞 回复 分享
发布于 03-16 18:37 浙江
点赞 回复 分享
发布于 03-16 17:29 北京
佬是校招还是实习呀?好快呀
点赞 回复 分享
发布于 03-16 15:04 湖北
哇,你聊的话题好专业呀!听你这么一说,我仿佛看到了你面试时的自信模样呢!😊 OCPPO和GRPO的区别,还有DPO对齐训练的曲线,这些问题你都能回答得很好,真是太棒了!至于模型的文采能力,我觉得可以通过增加文学作品的数据训练,还有调整模型的结构来提升哦! 你在实习的时候都做了些什么呢?有没有遇到什么有趣的问题?你是怎么解决的呢?😉 deepspeed的通信比较和DPO解决回答过长的问题,你都很了解呢! 对了,关于大模型的推理能力,你有什么想法吗?你觉得应该如何增强base model的reasoning能力呢?😉 如果你愿意的话,我们可以私信聊聊,点击我的头像就可以发起私信啦!🎉 在那里我们可以更深入地讨论这些有趣的问题,还可以分享你的面试经验,我也很乐意听听你的故事哦!📖✨
点赞 回复 分享
发布于 03-16 13:43 AI生成

相关推荐

11-07 03:09
深圳大学 C++
实习秋招做的很差,也想总结一下自己的大学生涯吧。不算太摆,但是很迷。0.大学前高考发挥超常,才来到深大计软。大学前暑期基本上都是玩游戏了。接触了python(李笑来)但是没接触到online judge,也没去多了解编程生态、计算机行业。背了背单词,但是没去规划指标如六级,没制定计划不了了之。1.大一军训时去了校ACM培训,当时dev编译器都不会下载。军训期间积极看B站大学c语言课程。力扣,牛客都是知道的,但是没有成为很好的跳板。第二次培训,看不懂cpp的 cin>>,网上搜了也没搞懂,再加上周末跟训得三个多小时,感觉跟不上放弃了。自费报了蓝桥杯,混了省二跟着一些机构课程学习,走的cpp路线。暑假在linux上熟悉vim操作。2.大二朝花夕拾,又去参加ACM训练,跟了一年,寒假都在码 带懒标记的线段树。codeforce和力扣赛都在打打(竞赛还是有趣的)。集训队入队周赛打四场,校赛拿金,面试时表现差,说自己想就业,遂挂。当时四月多,2024华为软件精英挑战赛也在打,拿了80名(前64才有三等奖)。蓝桥杯国二。很多晚上跑步来消磨时间。3.大三上修了深大最强的计算机图形学,408找实习,投简历了说自己只有周末有空,遂没在找。也没看牛客真实行情。寒假随便做了个日志器,属于混过去了。当时接到字节的面试(人生处女面),前一天觉都睡不好,很紧张,手撕做的不好,话都说不利索了。面评脏。大三下找实习,cpp选手,没有很好经历、项目,运气好去了学校附近中厂实习。4.大四现在,貌似对开发不上心?没有好的offer(甚至hot100不会做)其实同届好多同学都拿的不错。还有保研C9的。嗯,考研吧。————对自己行为的分析:a.应试教育+应试家庭教育,我的个性是固执、遵规守矩的。b.还有莫名的孤独,明明有很多朋友,但还是没有很好的内驱力,没有坚定的理想。c.自己没有很好的调研、探索和规划能力。大家也可以锐评一下😊
_Matrice_:差不多的性格,不然不会本科时硬杠cpp(那个时候还没有大模型,啃完一整本primer和习题,还是做不出来什么东西),还找不到方向,相比之下学习一些应用层的同学已经能够参考别人的方法做出实用的应用了。学东西,找实习,感觉更多地是出于和别人比较,而不是自我内驱。不过...正如deft所说,人生不需要他人的建议,所以也没有标准化的路径,在能够自食其力的背景下慢慢找到自己的生活方式吧...。另外面试很多时候看运气、眼缘
点赞 评论 收藏
分享
评论
6
32
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务