顺丰大模型算法工程师一面

1,介绍RAG流程,分段有没有做优化;编码模型和重排模型用了什么;Qwen3系列和bge系列的原理,Qwen3系列编码模型是怎么训练的

2,RAG怎么评估,用了哪些指标;RAGAS有哪些指标,为什么不直接用库

3,Agent的思想是什么,Agent包含哪些部分;介绍DeepResearch;介绍Agent怎么做任务规划和问题分解

4,SFT数据集怎么构建,问题不够多样化怎么解决

5,介绍LoRA原理;LoRA分支怎么初始化,为什么这么做

6,self-attention公式;为什么要scaling

7,介绍KV Cache;vllm是怎么加速推理

8,RLHF,介绍PPO,包含多少个模型;GRPO与PPO的区别;GRPO的缺点;介绍GSPO

全部评论

相关推荐

评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务