腾讯WXG NLP算法一面面经
- 项目
狠狠拷打40分钟
- 八股
1. 解释LORA训练方法
2. 有了解传统精排方法吗,比如LTR
3. 有了解Qwen3的embedding和Reranker模型吗
4. 结合项目讲大模型训练的几个阶段的特点和异同
5. 介绍GRPO、PPO、DPO,分别需要几个模型,需要训练的是哪些
6. 重要性采样有哪些方法(裁剪、KL和加权归一)
7. GRPO让英伟达股市暴跌原因是什么,资源省在哪
8. 介绍GSPO的优化,腾讯最近出的SPO有关注吗
- 代码
1. Pytorch实现GQA
2. 接雨水(两种方法)
3. SQL题