美团大模型推荐算法二面-日常实习
1.Qwen3-8B这里为什么使用 base 而不使用 instruct 模型
2.topk和 topp 是什么?
3.这个项目为什么不用 RL?
4.Transformer 降维是怎么做的?的基本结构,并解释自注意
5.Transformer 力机制。
6.使用的 Embedding 模型结构是什么?输出向量维度是多少?
7.代码:分析时间复杂度和空间复杂度。
2.topk和 topp 是什么?
3.这个项目为什么不用 RL?
4.Transformer 降维是怎么做的?的基本结构,并解释自注意
5.Transformer 力机制。
6.使用的 Embedding 模型结构是什么?输出向量维度是多少?
7.代码:分析时间复杂度和空间复杂度。
全部评论
相关推荐
2025-12-27 14:38
华南农业大学 前端工程师 点赞 评论 收藏
分享
查看8道真题和解析