阿里控股LLM一面面经
1. 问项目,问的很细
2. 问论文亮点
3. dapo的改进有哪些?
4. lora原理?
5. 推理分为哪两个阶段?(prefill和decode两个阶段)
6. self attention怎么做的?(qkv含义+计算流程)
7. 预训练模式是啥?和sft的区别?(next token prediction;区别是sft不算prompt的loss)
无手撕
2. 问论文亮点
3. dapo的改进有哪些?
4. lora原理?
5. 推理分为哪两个阶段?(prefill和decode两个阶段)
6. self attention怎么做的?(qkv含义+计算流程)
7. 预训练模式是啥?和sft的区别?(next token prediction;区别是sft不算prompt的loss)
无手撕
全部评论
相关推荐
查看7道真题和解析 点赞 评论 收藏
分享