26字节大模型算法秋招面经

1.实习介绍
2.critique mode 怎么训练的,会不会存在 bias
3.介绍下 RLHF 流程
4.BN和 LN 的区别, BN 在训练阶段和推理阶段有何不同
5.如果让你用 llm 做一个商品类目识别的项目,你会如何设计
6.介绍下 transformer , attention 的细节和 mlp 的作用
7.deepspeed的原理
8.了解 dp 和 ddp ,介绍一下原理和异同
9.在 nlu 任务上,你觉得 bert 和 llm 哪个效果会更好,为什么
6.介绍下 RLHF 流程
7. deepspeed 的原理
8.了解 dp 和 ddp ,介绍一下原理和异同
9.如果让你用 llm 做一个商品类目识别的项目,你会如何设计
10.快排的思想,时间复杂度
11.代码题: code :手写一个多分类的公式,并用代码实现
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务