腾讯LLM算法二面-暑期实习

整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1. 项目拷打
2. 介绍Attention,从数学角度解释一下为啥注意除以\sqrt{d_k}?
3. Agent多轮对话中有哪些难点
4. SFT数据集构建策略
5. 介绍DPO、GRPO、PPO区别
6. 如果评估RAG,评估RAG是否work
7. 说一下大模型全参数微调的显存计算?说一下SMoE怎么推理的?相比于稠密模型有什么优点?
8. 最近看了什么论文和技术报告?推荐算法和大模型有什么地方可以结合呢?
9. 手撕:搜索排序数组
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务