📍面试公司:阿里控股🕐面试时间:26届秋招💻面试岗位:机器学习❓面试问题:1. 问项目2. 正样本比较少的时候怎么去解决这个问题?3. InfoNCE中的超参调整,怎么理解(正负样本比例和batch size)4. InfoNCE和其他loss有没有什么联系?5. 了解多模态大模型,如Qwen-VL吗?6. lora(接在旁边/后面),为什么不接在后面?rank高低有什么影响,对于少量样本,lora好还是sft好?相对于sft的优劣势?7. Deepseek r1中的训练方式有什么特别之处?怎么做的think?RLHF的流程是什么?8. 量化加速方面有了解吗?解释一下vllm无手撕🙌面试感想:面试官很好,该有的流程都有,上来就说大概40分钟,时长不影响结果,并介绍了一下岗位对应部门的工作。面试官除了问问题,还会引导讨论,很尊重求职者。但还是太菜了,缺少LLM经历,很多都答不上来