面试很难,还是要多多练习1.项目拷打2.酣畅淋漓的技术八股...*-讲一下Wan(阿里的通义万相)的框架是什么*-是否了解MM-DiT的框架*-对于DiT,时间t是怎么注入的,AdaLN讲一下*-了不了解VideoVAE是怎么训练的,用了什么损失函数,如果重建视频不清晰可以再加什么Ioss*-KL散度具体的公式是什么样的?和交叉熵损失函数有什么区别联系*-是否了解Flowmatching,具体是怎么做的,和DDPM的优劣*-讲一下Classifier-Free Guidance*-是否了解视频后训练怎么做的,GRPO是什么*-你觉得对于训练一个视频基模,应该有哪几个流程,哪一步比较关键*-训练过多大的模型,用了多少张卡*-训练过程中是否遇到过不稳定的情况,本质上是因为什么*-是否了解混合精度,FP16和BF16的区别*-是否了解大模型训练中的几种并行(DP,PP,TP,EP)3.手撕: 经典 multi-headattention