腾讯多模态算法二面-实习凉经

面试很难,还是要多多练习
1.项目拷打
2.酣畅淋漓的技术八股...
*-讲一下Wan(阿里的通义万相)的框架是什么
*-是否了解MM-DiT的框架
*-对于DiT,时间t是怎么注入的,AdaLN讲一下
*-了不了解VideoVAE是怎么训练的,用了什么损失函数,如果重建视频不清晰可以再加什么Ioss
*-KL散度具体的公式是什么样的?和交叉熵损失函数有什么区别联系
*-是否了解Flowmatching,具体是怎么做的,和DDPM的优劣
*-讲一下Classifier-Free Guidance
*-是否了解视频后训练怎么做的,GRPO是什么
*-你觉得对于训练一个视频基模,应该有哪几个流程,哪一步比较关键
*-训练过多大的模型,用了多少张卡
*-训练过程中是否遇到过不稳定的情况,本质上是因为什么
*-是否了解混合精度,FP16和BF16的区别
*-是否了解大模型训练中的几种并行(DP,PP,TP,EP)
3.手撕: 经典 multi-headattention
全部评论
是青云吗
点赞 回复 分享
发布于 03-24 08:21 美国

相关推荐

04-22 16:17
已编辑
电子科技大学 算法工程师
看了大家不少面经,我也发发面经攒人品✉️投递:3.18💬面试:一面 3.23 二面 3.25 三面 4.3 HR面 4.13📝offer:4.21🎙️我的感受:我由于测评不高,面到HR面的时候非常的焦虑,很怕因为测评给我挂了我投的淘天全挂了,可能就是因为测评不行吧总体下来阿里的面试官还是挺尊重的,拷打的很详细bg:双九,一段小厂对口实习面试主要内容狠狠拷打简历,实习内容,问的非常详细,会问到你负责了什么,用了多少张卡,学习率怎么样,训练了多久,用了多少数据,数据是怎么准备的,显存占用怎么样场景题:如果我目前有一个数字人的模型,我想训练成只生成一个人的,可以怎么做你看过什么别的 SOTA 模型的 ref image 注入方式,有什么优劣八股:如何判断模型是否收敛如果训练的时候梯度消失或者爆炸,你怎么解决如何系统判断是否训练完成,特别是在视频生成模型中有哪些常见的蒸馏方法LoRA 微调的原理DiT 的框架流程,如何时间注入,讲一讲 AdaLN讲一下 flow Matching,原理,优势现在为什么大家都用 RMSNorm 而不是 LayerNormAdam 和 AdamW 的原理,有什么改进手撕:1. 二叉树的右视图2. 非 hot 100,滑动窗口3. 扎破所有气球的最少箭数暑期实习还是太折磨了,我面了好多场,一直在泡池子。。。腾讯二面给我泡了13天然后挂,米哈游一面挂,快手简历挂。。。看到身边同学都拿到offer了,那是一个焦虑啊,本来都想转日常了。最后总算是有一个结果了
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务