字节算法一面1h燃尽了...
1.拷打项目
2.损失函数设计
3.LoRA吟唱
4.手撕MHA
5.看你除以了根号k 有什么作用
6.梯度消失和梯度爆炸 如何缓解
7.QKV代表什么 说说理解
8.如果QK变成同一个矩阵你觉得有什么影响
9.除了LoRA还有什么微调的方法
实习并未拷打
做的主要是Agent相关的
简单问了下RAG和CodeAct就过了
手撕
面试官说出个简单一点的
n个长为m的升序数组,找TOPK
2.损失函数设计
3.LoRA吟唱
4.手撕MHA
5.看你除以了根号k 有什么作用
6.梯度消失和梯度爆炸 如何缓解
7.QKV代表什么 说说理解
8.如果QK变成同一个矩阵你觉得有什么影响
9.除了LoRA还有什么微调的方法
实习并未拷打
做的主要是Agent相关的
简单问了下RAG和CodeAct就过了
手撕
面试官说出个简单一点的
n个长为m的升序数组,找TOPK
全部评论
相关推荐
点赞 评论 收藏
分享
途虎成长空间 193人发布
查看6道真题和解析