社招第一次面试手撕了这么多代码.....太硬核了!基操:项目做的是什么?你训练算法过程中一般用哪些损失函数?中途插入问题:qwenvl系列的模块设计由哪些部分组成?然后就直接开始手撕代码了:多模态输入、Token 处理、Self/Cross Attention、Mask、LoRA、Dataset/DataLoader、训练流程、累计梯度、eval、多进程通信、微调方法 全都要会写代码。多模态大模型算法岗 · 高频面试题 + 标准答案(完整版)1. 多模态模型(图文)输入是怎么 Tokenize 的?答:文本用文本分词器转成文本 Token。图片不直接分词,而是切成固定大小的 Patch,每个 ...