无论文勇闯算法岗——字节推荐一面
1、项目介绍了很久
2、transformer的的参数量,12D^2大概,qkv 3D^2 FFN有升维降维,大概8d^2,还有一部分是啥
3、qwen2.5VL中有哪些细节?(图片会复制为两帧,和视频保持一致;MROPE,视频帧的绝对时间编码,token压缩等等)
4、题目考的分治,我先说了一个hash的,面试官说不行,说这个数字是为了方便比大小的,只是一个相对值,然后想了很久,最后面试官给了思路,写出来了,写了四十分钟,螺母和螺丝匹配
面试给的改了一下,是
[S_1, S_2, S_3] [M_1, M_2 ,M_3]
然后可能有重复的
[S_1, S_2, S_2] [M_1, M_2 ,M_2]