阿里大模型算法二面-实习面经
1. 目前多模态大语言模型是如何融合文本与图像信息的?
2. 大语言模型的RLHF训练流程是什么?它存在哪些潜在风险?
3. 什么是Embedding?词嵌入和句嵌入有何不同?
4. 大语言模型中的Tokenization是如何工作的?不同模型的分词算法有何差异?
5. 对比大语言模型的增量推理和传统推理方式,增量推理的优势和实现难点是什么?
6. 介绍一下大语言模型中的知识蒸馏,它如何用于压缩模型体积?
7. 过往项目(细节追问)
8. 大语言模型的长文本处理能力有限,目前有哪些技术可以缓解这一问题?
9. 什么是大语言模型的“上下文窗口”?扩展上下文窗口对模型性能有何影响?
2. 大语言模型的RLHF训练流程是什么?它存在哪些潜在风险?
3. 什么是Embedding?词嵌入和句嵌入有何不同?
4. 大语言模型中的Tokenization是如何工作的?不同模型的分词算法有何差异?
5. 对比大语言模型的增量推理和传统推理方式,增量推理的优势和实现难点是什么?
6. 介绍一下大语言模型中的知识蒸馏,它如何用于压缩模型体积?
7. 过往项目(细节追问)
8. 大语言模型的长文本处理能力有限,目前有哪些技术可以缓解这一问题?
9. 什么是大语言模型的“上下文窗口”?扩展上下文窗口对模型性能有何影响?
全部评论
相关推荐
04-09 22:36
澳门大学 算法工程师 27暑期大李GOAT:今天二面的时候因为面试官问了场景题,但是那个场景题太容易了,一面就问过我类似的,一面面试官还耐心给我解答了,并且完全可以拿OpenClaw和Claude code的思路来套,我就说的很流畅被面试官质疑是不是拿AI搜的,然后我说最近面试比较多问的问题比较相似,只是换了场景,会不会凉啊😭
查看8道真题和解析 点赞 评论 收藏
分享