快手大模型应用算法一面 50min
1.面试官先简单介绍团队,然后进行自我介绍;
2.对项目和论文进行了细致询问;
3.为什么多头注意力能提升表达能力?
4.大模型中使用RMSNorm的原因?它和LayerNorm有何差异?
5.LoRA和PromptTuning的区别,以及各自适用的场景?
6.模型微调时是否遇到过过拟合?如何处理的?
7.大模型推理时的加速思路?
8.KV Cache是如何起作用的?为什么对长上下文推理很关键?
算法题手撕:
字符串的全排列。
二叉树序列化与反序列化。
2.对项目和论文进行了细致询问;
3.为什么多头注意力能提升表达能力?
4.大模型中使用RMSNorm的原因?它和LayerNorm有何差异?
5.LoRA和PromptTuning的区别,以及各自适用的场景?
6.模型微调时是否遇到过过拟合?如何处理的?
7.大模型推理时的加速思路?
8.KV Cache是如何起作用的?为什么对长上下文推理很关键?
算法题手撕:
字符串的全排列。
二叉树序列化与反序列化。
全部评论
相关推荐
01-23 12:11
湖南城市学院 Java 奔跑的suechil...:怎么评论区这么多打广告的
1.项目考虑是两个,可以加个项目
2.bg一般的话,不建议外卖加点评
,99%都过不了简历
3.找项目要么是自己找github好点的开源,要么是评论区找广告去跟着,要么就是星球找项目了
加油友友


点赞 评论 收藏
分享