腾讯推荐算法 一面 凉经分享
发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流
1. 项目拷打
2. 同品匹配输入大模型的token数平均是多少?
3. 为什么不适用传统的嵌入模型?
4. 为什么不先召回一部分数据再进行同品匹配?
5. 大模型项目中RAG是怎么做的,怎么进行文档划分和召回的?
6. Function call的SFT数据集是怎么构建的?
7. 了解哪些高效微调的方法?详细讲一下原理。
8. MLA的原理是什么,为什么在提高效率的同时保证的效果?
9. Deepseek的MOE和其他的MOE有什么区别?
10. 为什么要进行KV-cache,KV矩阵过大,是怎样影响效率的?
11. Bert模型的训练方式有哪几种?
12. 导师是否同意实习?
代码题:分屏IDE手撕
手撕MHA
字符串最长公共前缀
1. 项目拷打
2. 同品匹配输入大模型的token数平均是多少?
3. 为什么不适用传统的嵌入模型?
4. 为什么不先召回一部分数据再进行同品匹配?
5. 大模型项目中RAG是怎么做的,怎么进行文档划分和召回的?
6. Function call的SFT数据集是怎么构建的?
7. 了解哪些高效微调的方法?详细讲一下原理。
8. MLA的原理是什么,为什么在提高效率的同时保证的效果?
9. Deepseek的MOE和其他的MOE有什么区别?
10. 为什么要进行KV-cache,KV矩阵过大,是怎样影响效率的?
11. Bert模型的训练方式有哪几种?
12. 导师是否同意实习?
代码题:分屏IDE手撕
手撕MHA
字符串最长公共前缀
全部评论
相关推荐
03-25 09:35
门头沟学院 推荐算法 落北北:强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
查看21道真题和解析 点赞 评论 收藏
分享