阿里控股机器学习面经

📍面试公司:阿里控股

🕐面试时间:26届秋招

💻面试岗位:机器学习

❓面试问题:

1. 问项目
2. 正样本比较少的时候怎么去解决这个问题?
3. InfoNCE中的超参调整,怎么理解(正负样本比例和batch size)
4. InfoNCE和其他loss有没有什么联系?
5. 了解多模态大模型,如Qwen-VL吗?
6. lora(接在旁边/后面),为什么不接在后面?rank高低有什么影响,对于少量样本,lora好还是sft好?相对于sft的优劣势?
7. Deepseek r1中的训练方式有什么特别之处?怎么做的think?RLHF的流程是什么?
8. 量化加速方面有了解吗?解释一下vllm

无手撕

🙌面试感想:
面试官很好,该有的流程都有,上来就说大概40分钟,时长不影响结果,并介绍了一下岗位对应部门的工作。
面试官除了问问题,还会引导讨论,很尊重求职者。但还是太菜了,缺少LLM经历,很多都答不上来

#发面经攒人品#
全部评论
华子终端云看看?
点赞 回复 分享
发布于 09-29 17:25 贵州
紧张就忘,楼主答不上来太正常了
点赞 回复 分享
发布于 09-28 14:48 辽宁
这些问题我背过又忘,感觉和楼主一样菜
点赞 回复 分享
发布于 09-28 14:48 山东

相关推荐

评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务