顺丰大模型算法工程师一面
1,介绍RAG流程,分段有没有做优化;编码模型和重排模型用了什么;Qwen3系列和bge系列的原理,Qwen3系列编码模型是怎么训练的
2,RAG怎么评估,用了哪些指标;RAGAS有哪些指标,为什么不直接用库
3,Agent的思想是什么,Agent包含哪些部分;介绍DeepResearch;介绍Agent怎么做任务规划和问题分解
4,SFT数据集怎么构建,问题不够多样化怎么解决
5,介绍LoRA原理;LoRA分支怎么初始化,为什么这么做
6,self-attention公式;为什么要scaling
7,介绍KV Cache;vllm是怎么加速推理
8,RLHF,介绍PPO,包含多少个模型;GRPO与PPO的区别;GRPO的缺点;介绍GSPO