6.16 京东物流大模型实习生(1.5h)

1.自我介绍
2.问项目的场景
3.问大模型的输入输出
4.问强化学习的项目
5.问GRPO,PPO,DPO的算法原理
6.什么时候用PPO,什么时候用GRPO
7.模型的SFT和PEFT训练的时候有什么小trick
8.有没有了解Agent和RAG,解释原理
9.算法题 最长公共子序列,环形链表
10.场景题 有没有了解复读机, 如何解决复读机问题
11.反问:业务是做ToB的多轮对话机器人,读取客户需求,营销产品,更多偏强化学习微调
12.三轮面试
全部评论

相关推荐

快乐的打工人求off...:GC回收主要是针对虚拟机中的堆中的对象,堆分为两部分,新生代和老年代,对新生代的垃圾回收称为minorGC,发生较为频繁,对老年代的GC称为majorGC,发生次数少但代价高;在GC开始之前,需要先标记出垃圾,一般有2种方法,引用计数法和可达性分析法;标记出对象之后需要进行垃圾回收,包括标记-清除算法,复制算法,标记-整理算法和分代回收算法。
查看6道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务