当代青年脆皮保护协会

2025-10-29 16:45 门头沟学院推荐算法

关注

字节多模态大模型一面面经

1.自我介绍和过项目
2.知道 deepspeed 和 megatron 吗，分别介绍一下
3.Decoder 文本生成有哪几种方法
4.Attention 为什么要做scaled ，不做会怎么样，为什么用根号 d _ k
5.说一下 Decoder 的因果注意力， QKV 分别来自哪
6.深挖多模态大模型论文用的video - llama ，讲一下大模型的结构
7.LoRA 初始化怎么做的，用的秩是多少，为什么不选其他的数
8. 介绍一下 ALBEF 、 BLIP

全部评论

推荐最新楼层

重庆师范大学自然语言处理

谢谢大佬

点赞回复分享

发布于 2025-10-30 18:58 重庆

手揽回忆睡

大连海事大学 Java

佬是双九吗，面试机会多吗

点赞回复分享

发布于 2025-10-29 22:26 辽宁

03-04 22:29

门头沟学院算法工程师

影石多模态大模型算法工程师一面面经攒人品

社招第一次面试手撕了这么多代码.....太硬核了！基操：项目做的是什么？你训练算法过程中一般用哪些损失函数？中途插入问题：qwenvl系列的模块设计由哪些部分组成？然后就直接开始手撕代码了：多模态输入、Token 处理、Self/Cross Attention、Mask、LoRA、Dataset/DataLoader、训练流程、累计梯度、eval、多进程通信、微调方法 全都要会写代码。多模态大模型算法岗 · 高频面试题 + 标准答案（完整版）1. 多模态模型（图文）输入是怎么 Tokenize 的？答：文本用文本分词器转成文本 Token。图片不直接分词，而是切成固定大小的 Patch，每个 ...

查看20道真题和解析

点赞评论收藏

分享

02-06 06:20

合肥工业大学算法工程师

字节大模型日常实习一面面经

整体感觉还是不错的，发一下问题供大家参考～八股吟唱：1、Pretrain、SFT、RLHF区别（目标、任务定位和解决的问题？）2、为什么偏好对齐不能直接用偏好数据做 SFT，而用RL3、Pretrain和 SFT 在优化目标上的区别4、SFT的loss是什么，若target有10或100个token，loss如何计算5、SFT 样本（含 prompt）与预训练样本在计算 Loss 时的区别，如何屏蔽prompt的Loss6、控制生成多样性的参数有哪些？怎么控制的？7、top-k与top-p 区别8、除了贪心，还有哪些生成策略？9、你对多模态的理解？10、最近读了什么论文？论文的核心亮点是什么？11、PPO和GRPO的结构区别，各自适用的场景？12、DAPO、GSPO具体做了什么改进？13、是否了解 Swift？DeepSpeed 与 Megatron 的区别手撕算法：交叉熵、Softmax、Self-Attention力扣139题 Word Break变种

查看15道真题和解析

点赞评论收藏

分享

02-09 12:53

浙江大学算法工程师

腾讯多模态大模型算法实习二面 40min

1.最近有尝试什么新想法吗？有没有试过 vision encoder 的桥接。2.ppu 是什么卡？自己有测试过性能和其他卡的对比吗？需要手写 cuda 吗3.介绍一下多模态长视频扩展方法，如何在现有模型上改，比如 llava？4.有考虑音频融合吗？新增一个音频模态你会怎么考虑？5.手撕： 编辑距离

查看5道真题和解析

点赞评论收藏

分享

02-26 12:43

中国科学院大学算法工程师

快手可灵多模态算法实习生

【可灵-视频生成-数据算法-实习生】职位描述1、为视觉生成模型构建高质量训练数据，兼顾多模态理解与生成相关工作，优化视觉生成模型的数据构建 pipeline，为模型性能提升提供可靠的数据支撑。2、设计并落地数据有效性验证方案，验证数据对视觉生成模型训练的实际作用，探索数据在模型训练中的有效性。3、在顶会顶刊上发表研究成果和开源代码，提升团队在多模态视频生成等领域的学术声望。任职要求1、硕士以上学历（在校生优先），计算机、人工智能、计算机视觉、数学等相关专业，具备多模态理解、视觉生成相关基础；2、熟悉视频生成基础模型如SVD、Sora、meta moviegen、hunyun video等；3、熟悉多模态大语言模型（deepseek/qwen等）、多模态理解生成、世界模型；加分项：1、有多模态大语言模型、图像/视频生成大规模训练和数据构建经验者优先；2、学习能力强、自驱、代码能力强、善于解决问题者优先；3、有一作顶会或顶刊论文发表经历或相关知名大模型开源项目者优先。联系邮箱：xuyulong03@kuaishou.com

点赞评论收藏

分享

02-05 08:35

西安交通大学算法工程师

快手多模态大模型一面凉经

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1. 实习介绍2. 项目拷打3. 4B的模型部署需要多少显存？怎么算的？4. （项目）LoRA的数据怎么来的，结构长啥样？5. 说一下LoRA的原理；怎么理解“低秩”（r为什么远小于d）6. 了解Agent吗？说一下你做过的Agent workflow的具体流程7. 说一下LSTM的原理；其中门控机制提出是为了解决什么问题？8. 手撕代码：多头注意力；约瑟夫环

查看8道真题和解析

点赞评论收藏

分享

评论

4

28

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 交出你的校招焚诀 #

12347次浏览 206人参与

# 公司情报交流地 #

144794次浏览 1276人参与

# 神州信息求职进展汇总 #

3879次浏览 72人参与

# 三月的小目标 #

14075次浏览 269人参与

# 27届求职交流 #

4427次浏览 107人参与

# 面试___岗的必刷题单 #

13999次浏览 251人参与

# 26届求职交流 #

3750次浏览 79人参与

# 硬件人的简历怎么写 #

329941次浏览 3090人参与

# 教师节，你送祝福了吗 #

24975次浏览 101人参与

# 你的秋招第一面感觉怎么样 #

140685次浏览 806人参与

# 实习生至暗时刻 #

20497次浏览 406人参与

# 米哈游求职进展汇总 #

587029次浏览 3021人参与

# 哪些公司开暑期实习了？ #

19998次浏览 158人参与

# 经纬恒润求职进展汇总 #

153334次浏览 1080人参与

# 你的秋招第一场笔试是哪家 #

294837次浏览 2085人参与

# AI面试问题分享 #

14962次浏览 301人参与

# 找AI工作应该卷什么？ #

4715次浏览 88人参与

# 春招开局，你有保底offer吗？ #

28143次浏览 224人参与

# 你经历过哪些AI幻觉？ #

5469次浏览 129人参与

# 多益网络求职进展汇总 #

71096次浏览 306人参与

# 实习想申请秋招offer，能不能argue薪资 #

225296次浏览 1199人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务