腾讯春招大模型算法一面 攒人品中

发一下问题给大家参考,攒攒人品!
1. 什么是MHA
2. Attention运算公式
3. 为什么除以根号dk
4. 介绍现有相对位置编码和绝对位置编码的异同点,都有哪些结构
5. RoPE的结构
6. RoPE相比于绝对位置编码的优势是什么?为什么外推性更好?
7. 为什么RoPE理论上可以无限外推?
8. RoPE为什么可以利用绝对位置和相对位置的优势?
9. 介绍RAG项目(基座模型是什么?几b ?全参微调用了多少卡?数据多大?问答对的形式有图片吗?
10. 对RAG的理解是什么?为什么要用RAG?
11. BGE模型的结构
12. 什么是LoRA?有个两层神经网络,参数1万*一万,低秩r =100, LoRA参数量是多少?
13. 为什么用KV Cache?
14. KV Cache有哪些优化方法?
15. 文生图/图生文结构了解吗?文生图的怎么解码的
16. CLIP了解吗?
17. Deepseek MOE架构路由机制的细节
18. 场景题
21. 手撕:快速排序
全部评论

相关推荐

04-01 16:02
已编辑
武汉工程大学 Java
牛客98843461...:处女面??我还种马面渣男面处男面呢
点赞 评论 收藏
分享
05-10 16:48
门头沟学院 Java
程序员小白条:主要原因,投递太晚了,快手应该早点溜了,你都从去年9月开始的,半年也差不多3月跑路了,这样的话,至少有5个以上的面试机会
点赞 评论 收藏
分享
评论
点赞
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务