快手大模型应用算法一面 50min

1.面试官先简单介绍团队,然后进行自我介绍;
2.对项目和论文进行了细致询问;
3.为什么多头注意力能提升表达能力?
4.大模型中使用RMSNorm的原因?它和LayerNorm有何差异?
5.LoRA和PromptTuning的区别,以及各自适用的场景?
6.模型微调时是否遇到过过拟合?如何处理的?
7.大模型推理时的加速思路?
8.KV Cache是如何起作用的?为什么对长上下文推理很关键?
算法题手撕:
字符串的全排列。
二叉树序列化与反序列化。
全部评论

相关推荐

除了Java,最推荐学什...
点赞 评论 收藏
分享
奔跑的suechil...:怎么评论区这么多打广告的 1.项目考虑是两个,可以加个项目 2.bg一般的话,不建议外卖加点评,99%都过不了简历 3.找项目要么是自己找github好点的开源,要么是评论区找广告去跟着,要么就是星球找项目了 加油友友
点赞 评论 收藏
分享
评论
3
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务