阿里控股机器学习面经
📍面试公司:阿里控股
🕐面试时间:26届秋招
💻面试岗位:机器学习
❓面试问题:
1. 问项目
2. 正样本比较少的时候怎么去解决这个问题?
3. InfoNCE中的超参调整,怎么理解(正负样本比例和batch size)
4. InfoNCE和其他loss有没有什么联系?
5. 了解多模态大模型,如Qwen-VL吗?
6. lora(接在旁边/后面),为什么不接在后面?rank高低有什么影响,对于少量样本,lora好还是sft好?相对于sft的优劣势?
7. Deepseek r1中的训练方式有什么特别之处?怎么做的think?RLHF的流程是什么?
8. 量化加速方面有了解吗?解释一下vllm
无手撕
🙌面试感想:
面试官很好,该有的流程都有,上来就说大概40分钟,时长不影响结果,并介绍了一下岗位对应部门的工作。
面试官除了问问题,还会引导讨论,很尊重求职者。但还是太菜了,缺少LLM经历,很多都答不上来
#发面经攒人品#
🕐面试时间:26届秋招
💻面试岗位:机器学习
❓面试问题:
1. 问项目
2. 正样本比较少的时候怎么去解决这个问题?
3. InfoNCE中的超参调整,怎么理解(正负样本比例和batch size)
4. InfoNCE和其他loss有没有什么联系?
5. 了解多模态大模型,如Qwen-VL吗?
6. lora(接在旁边/后面),为什么不接在后面?rank高低有什么影响,对于少量样本,lora好还是sft好?相对于sft的优劣势?
7. Deepseek r1中的训练方式有什么特别之处?怎么做的think?RLHF的流程是什么?
8. 量化加速方面有了解吗?解释一下vllm
无手撕
🙌面试感想:
面试官很好,该有的流程都有,上来就说大概40分钟,时长不影响结果,并介绍了一下岗位对应部门的工作。
面试官除了问问题,还会引导讨论,很尊重求职者。但还是太菜了,缺少LLM经历,很多都答不上来
#发面经攒人品#
全部评论
华子终端云看看?
紧张就忘,楼主答不上来太正常了
这些问题我背过又忘,感觉和楼主一样菜
相关推荐
点赞 评论 收藏
分享

点赞 评论 收藏
分享
点赞 评论 收藏
分享


点赞 评论 收藏
分享