1.我说最感兴趣的是多模态大模型,面试官说他们做的是业务,不会预训练大模型,怕我不感兴趣(我说我就是想做多模态的业务)。先介绍了组的业务,大概是内容理解和治理,涉及到的模态有图像/文本/视频等。(因为我一直在强调不想做单纯的图像任务,因为考虑到校招的难度,想过度到多模态)2.深挖字节电商内容治理的实习(做的基本是图像的任务)训练过程,基于llava的VQA为什么比直接分类好?prompt的作用3.多头注意力,focal loss4.求一个数的平方根5.反问:会不会只做图像?业务数据规模有多大(大概几百万)?如果过了,学校还有事一个月后再入职行不行。得物离学校特别近(这样老师找我就能马上回来啦)...