项目狠狠拷打40分钟八股1. 解释LORA训练方法2. 有了解传统精排方法吗,比如LTR3. 有了解Qwen3的embedding和Reranker模型吗4. 结合项目讲大模型训练的几个阶段的特点和异同5. 介绍GRPO、PPO、DPO,分别需要几个模型,需要训练的是哪些6. 重要性采样有哪些方法(裁剪、KL和加权归一)7. GRPO让英伟达股市暴跌原因是什么,资源省在哪8. 介绍GSPO的优化,腾讯最近出的SPO有关注吗代码1. Pytorch实现GQA2. 接雨水(两种方法)3. SQL题