快手多模态日常实习一面
1.默写二元交叉熵损失函数
2.是否了解Sigmoid函数,Sigmoid函数有什么缺点
3.MHA的运行机制
4.为什么Transformer使用三角函数位置编码,相比于[1,2,3..]这种硬编码的好处在哪?
5.Transformer的Attention计算过程中为什么要对QK的点积进行scale
6.CLIP学习的范式,是如何构造正负样本对,如何进行对比学习
7.解释Q-former机制,以及其中可学习Query的意义
8.Temperature有什么作用
9.聊项目
10.代码:搜索旋转排序数组
2.是否了解Sigmoid函数,Sigmoid函数有什么缺点
3.MHA的运行机制
4.为什么Transformer使用三角函数位置编码,相比于[1,2,3..]这种硬编码的好处在哪?
5.Transformer的Attention计算过程中为什么要对QK的点积进行scale
6.CLIP学习的范式,是如何构造正负样本对,如何进行对比学习
7.解释Q-former机制,以及其中可学习Query的意义
8.Temperature有什么作用
9.聊项目
10.代码:搜索旋转排序数组
全部评论
相关推荐
lishing:确实给少了 我本科当时开了60k*20加200w股票都拒了 点赞 评论 收藏
分享
点赞 评论 收藏
分享
哞客37422655...:智力题磕磕绊绊都能过,说明技术好,HR面别嘴瓢
点赞 评论 收藏
分享
曼迪匹艾公司福利 138人发布