快手大模型应用算法一面 50min

1.面试官先简单介绍团队,然后进行自我介绍;
2.对项目和论文进行了细致询问;
3.为什么多头注意力能提升表达能力?
4.大模型中使用RMSNorm的原因?它和LayerNorm有何差异?
5.LoRA和PromptTuning的区别,以及各自适用的场景?
6.模型微调时是否遇到过过拟合?如何处理的?
7.大模型推理时的加速思路?
8.KV Cache是如何起作用的?为什么对长上下文推理很关键?
算法题手撕:
字符串的全排列。
二叉树序列化与反序列化。
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务