字节算法秋招一面1h

讲解项目,过程中进行提问
1.讲解Transformer 的结构。
2.为什么要进行多头注意力?
3.注意力计算的计算复杂度是多少?
4.用bert做下游任务时,输入有哪些embedding?
5.用bert做分类任务时,输出是怎么处理的?
6.在训练模型时,如果遇到loss不稳定,如何去优化?
7.常用什么训练框架?
8.讲解  LoRA 原理。
9.常用的不同模态数据在embedding层面对齐的方法有哪些?
10.多模态模型怎么训练?
11.介绍一下 CLIP 模型。
12.常用的对比学习有哪些方法?怎么构造数据的?
13.RAG检索召回的片段中,有一些质量差的,如果排除掉?
14.排序模型关注的指标是什么?
15.C++中,指针和智能指针的区别?
16.C++中,什么函数的作用?没听清,不太了解。
code:二叉树的层序遍历
反问
全部评论

相关推荐

不愿透露姓名的神秘牛友
11-25 09:53
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务