字节算法一面1h燃尽了...

1.拷打项目
2.损失函数设计
3.LoRA吟唱
4.手撕MHA
5.看你除以了根号k 有什么作用
6.梯度消失和梯度爆炸 如何缓解
7.QKV代表什么 说说理解
8.如果QK变成同一个矩阵你觉得有什么影响
9.除了LoRA还有什么微调的方法

实习并未拷打
做的主要是Agent相关的
简单问了下RAG和CodeAct就过了

手撕
面试官说出个简单一点的
n个长为m的升序数组,找TOPK
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务